A Meta mesterséges intelligenciája akkora stratéga, hogy egy játék szerint elfoglalta volna Európát az I. világháborúban

2022.11.25. · tudomány

A Meta mesterséges intellgiencia kutatócsoportja, a FAIR összerakott egy olyan rendszert, ami a játékosok 90 százalékánál jobb teljesítményre képes a Diplomacy nevű, egyszerre kooperatív és kompetitív stratégiai játékban. A Science-ben publikált eredmények szerint a Meta mesterséges intelligencia (MI) rendszere, Cicero mind stratégiai gondolkodásban, mind stratégiai kommunikációban a játékosok legjobb 10 százalékába tartozott, egy nyolcfordulós tornán pedig az összes humán ellenfelét legyőzte.

A Diplomacy játékban a játékosok hét fős csapatokban teljesítenek küldetéseket, miközben egyszerre kénytelenek együttműködni és egymás ellen is taktikázni. Eddig még nem lenne kifejezetten érdekes a Meta által alkotott Cicero teljesítménye, csakhogy a játékban, ahogy a neve is sugallja, kulcsszerepet tölt be a kommunikáció. Cicero a több óra játékidejű, 1950-es években tervezett klasszikus táblajáték online verziójában játszott, ahol a játékmenet megegyezik az eredeti stratégiai játékéval. A játék az I. világháború előtti évek Európájába repít vissza, a játékosok célja, hogy államközi egyezségek révén elfoglalják Európát. A stratégiai párbeszédekre építő játékban az egyes játékosok hol szövetségeket kötnek, hol elárulják egymást, így juthatnak közelebb a céljaikhoz. A Diplomacy egyik legnagyobb nehézségét épp az jelenti, hogy a játékosoknak úgy kell mások bizalmát elnyerniük, hogy közben mindenki tudja: nem érdemes bíznia senkiben.

Példák Cicero beszélgetéseiből
photo_camera Példák Cicero beszélgetéseiből Fotó: META FAIR kutatócsoport

A példák szerint Cicero Ausztria és Franciaország szerepében is meggyőzte játékostársait, hogy az ő stratégiáját kövessék, így nemcsak sikeresen kötött szövetségeket, de az akaratát is keresztülvitte olyan esetekben, amikor arra egy újdonsült szövetségese nem is akart eleinte hajlani.

Cicerót a Meta két komponensból rakta össze, egy stratégiaépítő és egy kommunikációs rendszerből. A taktikázó szoftver korábban már bizonyított, utóbbit pedig a Diplomacy online verziójának 50 ezer párbeszédével tanították stratégiai kommunikációra. Az éles játékok során az MI játékonként átlagosan mintegy 290 üzenetet küldött a játékostársainak. A megfelelő kommunikációnak nemcsak azért van fontos szerepe, mert a játékos által felépített stratégiát azon keresztül kénytelen kivitelezni hanem azért is, mert a játékos kompetenciáját is mutatja, vagyis nem megfelelő kommunikáció esetén előfordulhat, hogy a többiek inkább másokkal fognak össze. Nem utolsó sorban az MI le is bukhatott volna, ha gyakran nem tudja megfelelően felvenni a beszélgetés fonalát.

Az algoritmus két hónapon keresztül, augusztus közepétől október közepéig összesen 40 játékban vett részt, amelyekben a játékosok ötperces diplomáciai szakaszokat használhattak, a teljes játék így két óra alatt véget ért. A játékosok tudták, hogy a szóban forgó időszak alatt egy MI rendszert is tesztelnek a játékban, de azt nem tudták, hogy az ő játékidejük alatt összefuthatnak-e vele, illetve a felhasználónevek sem voltak nyilvánosak, így árulkodóak sem. Az algoritmus összesen 82 hús-vér emberrel játszott, és a játékok során egyetlen játékos sem jelezte, hogy egyik társában gépet vélt volna felfedezni. A 82 játékos egyike egy játék utáni csevegés során megfogalmazta ugyan, hogy Cicero gyanús volt a számára, ám a gyanúja nem terjedt el a játékosok körében.

Kapcsolódó cikkek a Qubiten:

link Forrás
link Forrás
link Forrás