70 ezer órát szánt rá, de megtanult minecraftozni az OpenAI mesterséges intelligenciája
Az OpenAI mesterséges intelligenciája már egész jó szövegeket generál és meghökkentően reálisnak látszó arcokat készít, mostanra pedig a világ egyik legnépszerűbb videojátékával is elboldogul. Ehhez Youtube-videók tömkelegét nézte meg és megtanulta a legprofibb minecraftosok trükkjeit.
Ugyanazokat a billentyűzet- és egérparancsokat használja, mint az emberek, ugyanabban a játéktérben érvényesül, mint a playerek többsége, és magabiztosan ellátja a játékhoz szükséges feladatokat. Ilyenek a favágás, az úszás, a vadászat, a főzés és a „pillar jumping”, vagyis a Minecraftből ismert „önmagunk alá” építkezési megoldás.
A tanulási folyamat érdekessége, hogy a kutatók szerint egyelőre nincs még egy olyan publikált betanítási folyamat, amelyben a nem módosított emberi cselekvésekkel tanult volna a mesterséges intelligencia, ebbe a Minecraft esetén beleértendő a „drag-and-drop” (fogd és vidd) tárgykezelés és a különböző eszközök elkészítése a játékban. Természetesen a finomhangolás még hátra van: fókuszált adathalmazzal zajlik majd, ezzel teszik még megbízhatóbbá az algoritmust, de a fejlesztők már most bizakodók.
A Singularity Hub cikke konkrét példát is kiemel, amely szerint a mesterséges intelligencia egy, az emberek számára 20 percet igénylő feladatot is képes volt elsajátítani: megtanult gyémántcsákányt építeni a játékban. Ez az eredmény nemcsak azért kimagasló, mert a 2019-es fejlesztői versenyen a beérkezett 660 pályázatból egyik sem tudta teljesíteni a gyémántbányászatra vonatkozó feladatot, hanem azért is, mert a MI-fejlesztéseknek lökést adhat, hogy az algoritmus egy olyan bonyolult játéktérben is elboldogul, mint a Minecraft.
A betanítási folyamat másik különlegessége, hogy a tanuláshoz használt 70 ezer órányi Youtube-videó címkézése sem manuálisan történt. Mindössze 2000 órát dolgoztak fel emberek, ami elég volt egy másik mesterséges intelligencia betanításához, amely a fennmaradt videók címkézésével foglalkozott.
A minecraftezésen felül pont ez jelenti a VPT, vagyis a videós előképzés (video pre-training) gyakorlati hasznát: ahogy korábban a GPT-3 és a DALL-E esetében, most is a hatalmas rendelkezésre álló adathalmaz gépi értelmezésével érik el azt, hogy az algoritmus új, az eddigieknél bonyolultabb funkciók ellátását tanulja meg.
Kapcsolódó cikkek a Qubiten: