500 milliószor bújócskáztak egymással mesterséges intelligenciák, hogy szimulálják az evolúciót

Bodnár Zsolt

2019. szeptember 19.

TECH

Link másolása
Facebook
X (Twitter)
Tumblr
LinkedIn

Az Elon Musk által társalapított San Franciscó-i kutatócég, az OpenAI szépen csendben elkezdte syimul'lni az evolúciót. Mivel a mai élővilág, valamint az összetett emberi intelligencia is egyszerű mikroszkopikus szervezetekből fejlődött ki az évmilliárdokon át tartó versenynek és kiválasztódásnak köszönhetően, a kutatók azt tesztelik, hogy hasonló virtuális versengést imitálva létrehozható-e a jelenleginél kifinomultabb mesterséges intelligencia.

A kísérlet két létező technikát ötvöz: a többágenses tanulás (multi-agent learning) során több különböző algoritmust versenyeztetnek egymással, a megerősítéses tanulás (reinforcement learning) során pedig a gép nagy számú próbálkozásból, a sikeres és sikertelen nekifutásokból tanulja meg elérni a kitűzött célt – utóbbi a Google-féle DeepMind emberfeletti kísérletével, az AlphaGóval vált híressé.

Eszközhasználat és csapatjáték

Az OpenAI most két csapatnyi mesterséges intelligenciát eresztett egymásnak, hogy több százmillió körön keresztül bújócskázzon egymással, és közben olyan komplex stratégiákat dolgozzanak ki, amelyek eszközök használatára és csapatjátékra is alapulnak.

Ehhez egy olyan virtuális környezetet terveztek az AI-kutatók, amelyben a játékosok egy zárt térben tudtak bújócskázni, különböző mozgatható és nem mozgatható dobozok, rámpák használatával. Az egyes ágenseket két csapatra osztották, és mindkettőt a szerepüknek megfelelően jutalmaztak vagy büntettek, az alapján, hogy sikerült-e rendesen elbújni, illetve megtalálni a másikat. Azon kívül, hogy az elbújáshoz kaptak néhány másodpercnyi előnyt, semmilyen más instrukciót nem kaptak az AI-játékosok.

Közel 500 millió kör után azt látták a kutatók, hogy mindkét csapat több stratégiát dolgozott ki magának. Miután az első fázisban még a pálya objektumainak használata nélkül bujkáltak, a 25 milliomodik játszma környékén elkezdtek finomabb módszerekhez nyúlni a virtuális játékosok: a bújók erődöt építettek maguk köré a barikádokból és dobozokból, és ehhez még együtt is működtek, hogy minél gyorsabban végezzenek az építkezéssel.

Még 50 millió körrel később aztán a másik csapat is kidolgozta a maga ellenstratégiáját, amikor az ágensek rájöttek arra, hogy a rámpák mozgatásával felmászhatnak az építményekre, és megtalálhatják az elbújt ellenfeleiket. A 85 milliós határnál eljött a negyedik fázis is: a bújók ekkor már azt is kitalálták, hogy ha lezárják (vagyis mozgathatatlanná teszik) a rámpákat, akkor nem tudják őket felhasználni a keresőik.

Váratlan fordulat a véghajrában

Ezután az OpenAI kutatói azt gondolták, hogy már nem lesz több fázis, de a 380 milliomodik kör felé közeledve még két stratégiát kidolgoztak az ágensek: a keresők rájöttek, hogy ha egy lezárt rámpán felmásznak egy mozgatható dobozra, és annak a tetején elszörföznek az erődítményig, akkor már be tudnak jutni – valamivel később pedig ezt is kiküszöbölték a bújók, minden mozgatható objektum lezárásával.

„Nem mondtuk nekik, hogy menjenek oda a dobozokhoz, és használják fel őket. A többágenses versenyben egymásnak adtak új feladatokat, hiszen a megtanult stratégiákhoz a másik csapatnak alkalmazkodnia kellett” – mondta az MIT Technology Review-nak Bowen Baker, az eredményeket bemutató tanulmány egyik szerzője. Baker szerint a jövőben több hasonló versenyt igyekszenek rendezni mesterséges intelligenciával, így akár olyan problémákra is megoldást találhatnak, amiket embernek még nem sikerült megoldani.

Kapcsolódó cikkek a Qubiten:

Szintet lépett a mesterséges intelligencia: először tanult meg sakkozni egy AI emberi segítség nélkül

A Microsoft egymilliárd dollárral támogatja az emberszerű mesterséges intelligencia fejlesztését

Elon Musk szerint a jövő olyan lesz, mint a Mátrix, sőt lehet, hogy már abban élünk

Kapcsolódó cikkek

Szintet lépett a mesterséges intelligencia: először tanult meg sakkozni egy AI emberi segítség nélkül

Bodnár Zsolt tudomány 2018. december 13.

500 milliószor bújócskáztak egymással mesterséges intelligenciák, hogy szimulálják az evolúciót

Eszközhasználat és csapatjáték

Váratlan fordulat a véghajrában

Szintet lépett a mesterséges intelligencia: először tanult meg sakkozni egy AI emberi segítség nélkül

A Microsoft egymilliárd dollárral támogatja az emberszerű mesterséges intelligencia fejlesztését

Elon Musk szerint a jövő olyan lesz, mint a Mátrix, sőt lehet, hogy már abban élünk

Kapcsolódó cikkek

Szintet lépett a mesterséges intelligencia: először tanult meg sakkozni egy AI emberi segítség nélkül