A mesterséges intelligencia egész nap a tévé előtt döglene, ha hagynánk neki

Az OpenAI, a Berkeley és az Edinburghi Egyetem kutatói azon dolgoznak, hogy felpiszkálják a robotok kíváncsiságát, a kíváncsi mesterséges intelligencia ugyanis emberi irányítás nélkül is képes tanulni. Ahelyett, hogy az ágenst valamilyen külső jutalommal motiválták volna a tanulásra, „belső motivációval” látták el: kíváncsiságot adtak neki. 

A fogalom egyszerű definíciója szerint a mesterséges intelligencia azt fogja fel jutalomnak, ha valami váratlan történik vele, és számon tartja, hogy találkozott-e már azzal a környezettel vagy programmal, amivel szembesül, a lehetőségekhez mérten pedig igyekszik is kerülni az ismétlődést.

A robotokat klasszikus unaloműzéssel tesztelték: ötven különböző számítógépes játékra eresztették rá őket, köztük olyan klasszikusokra is, mint a Super Mario – ebben a robotok meglepően jól teljesítettek. A mesterséges intelligenciával 48 különféle klasszikus Atari-játékot is játszattak, ezt is nagyon élvezték – ezekben is, ahogy a Marióban, folyamatosan változik a játéktér.

Aki kíváncsi, hamar megöregszik

A folyamatos újdonságra törekvésnek megvannak az árnyoldalai is: az újdonságokhoz a kellemetlen dolgok is hozzátartoznak, így a kíváncsi robot csak beleugrasztja Mariót a csapdába, hogy megnézze, ilyenkor mi történik, de a Game Over felirat is örömmel tölti el. Az igazi bajok viszont csak akkor kezdődnek, ha a robot rászabadul a tévére. 

Harri Edwards, az OpenAI kutatója egy gondolatkísérlettel szemléltette a problémát: ha veszünk egy tévét, amelyen több adó található, de mindegyiken csak a fehér zaj jön be, egy valóban kíváncsi mesterséges intelligencia sosem unhatja meg a műsort, és fennáll a veszélye annak, hogy örökre leragad a zörejnél, hiszen az olyan véletlenszerűen jelenik meg a képernyőn, hogy gyakorlatilag lehetetlen, hogy arra számítson kapcsolás előtt, ami végül bejön. Edwards szerint van rá némi esély, hogy a boldogtalan intelligencia elszakadjon a tévétől, de ahhoz valami nagyon különlegesnek kell történnie a környezetében.

Van ennek értelme

A kísérlet végső célja természetesen nem az, hogy kórosan lusta vagy (az Atarival játszó minta esetében) nagyon boldog robotokat termeljünk ki, hanem a tanulás finomhangolása: miután a kíváncsiság belső motivációjával felszerelt mesterséges intelligencia képes volt egy számítógépes játékban felmerülő problémák megoldására, valószínűleg hasznosabban is képes eltöltenie az idejét, így például segíthet bugokat keresni egy hosszú kódban, vagy szintén bugok után kutatva végigjátszhat egy számítógépes játékot is.