Lehet, hogy a jövőnket tönkreteszi, de a múltunkat megfejti a mesterséges intelligencia

2023.06.29. · tudomány

A Gilgames-eposz mindenkinek megvan az iskolából, csak éppen azoknak nincs meg, akik valóban értenének hozzá. A négyezer éves mű nagy részét ugyanis a történészek és klasszika-filológusok csak kikövetkeztették abból, ami a rendelkezésükre állt, vagyis azokból a töredékekből, amiket sikerült kiásni, azonosítani, lefordítani és katalogizálni is. A történet sumér és akkád nyelven is fennmaradt, de az ékírásos szövegek persze sehol nem hiánytalanok, így mindenki azzal dolgozott, amivel tudott, ez pedig az esetek többségében a kutatók fantáziáját jelentette. Lehet, hogy neked is ott van a Gilgames a polcodon, de ez nem az a Gilgames.

Fragmentáció

A hiányok mellett a legnagyobb problémát a források összevisszasága jelenti: a különböző korokból származó és eltérő nyelveken írott agyagtáblák különböző múzeumokban is vannak, így az is előfordulhat, hogy egy fordító csak néhány méternyire ül egy hiányzó töredékből, mégsem találja meg. No meg az is, hogy több száz kilométernyire ül tőle, de akkor sem találja, így ez a végeredmény szempontjából majdnem mindegy is. Nem a modern kutatók az elsők, akiknek ez gondot okozott: a babilóniai történetekről már Hésziodosz és Aiszkhülosz is azt állították, hogy több száz évesek, és sokat változtak az idők során – annyit, hogy az ötvenes években több kutató is úgy gondolta, hogy ezek a mondák valójában görög eredetűek. A táblák viszont mást állítanak.

„Aki mindent látott és mindent megismert, megértvén minden dolgok tudnivalóit; aki látta birodalmak sorsát, s rejtett titkokat napfényre hozott; aki bölcs volt s minden mélység megnyílt őelőtte; aki hírt hozott a vízözön korából: hosszú utat tett meg s minden szenvedése kemény kőtáblákba lett végül bevésve.”

A fenti szöveget eredetileg ékírással, agyagtáblákon rögzítették, a meglévő szövegek alapján viszont csak nagyjából 60 százalékát tudták rekonstruálni. A legfőbb nehézséget az okozza, hogy az ékírás karaktereit a kontextus alapján lehet értelmezni: ha ez hiányzik, arra sem egyszerű választ adni, hogy mire gondolhatott a szerző. Enrique Jiménez, a müncheni Lajos-Miksa Egyetem régésze szerint ez azt is jelenti, hogy egy jelnek akár huszonötféle értelmezése is lehet, ami a többféle fordítással megtetézve szinte leküzdhetetlen kihívások elé állítják a kutatókat.

Különböző fiókok

A bajt tovább súlyosbítja, hogy a táblákat több különböző helyen őrzik: Jiménez szerint az is előfordulhat, hogy miközben valaki a British Museumban tanulmányoz egy táblatöredéket, és nem tud rájönni, hogy mik lehetnek a hiányzó szavak, a szomszéd szobában lévő tárló őrzi a titkot. Még rosszabb, ha csak egy sima fiók: akkor a büdös életben nem jön rá senki, hogy hova tartozik, hacsak nincs hatalmas szerencséje.

A Jiménez és kollégái által fejlesztett EBL (Electronic Babylonian Library) viszont megoldja a gondot: a digitalizált töredékek így összeilleszthetők, kutathatók és lefordíthatók is lesznek. Ezzel a középiskolások gondja is megoldódik: nem kell többé azon törniük a fejüket, hogy hogyan is értsék a Gilgamest. A projekt újdonsága, hogy a jórészt 19. századi leleteket egybefoglalja: ez eddig hiányzott, és így az átfogó kutatásukra sem nyílt lehetőség. A mostani, és még mindig folyamatban lévő gyűjtés megoldja ezt a problémát, az érdeklődők idővel a szövegek angol fordításaihoz is hozzáférhetnek majd.

photo_camera A szöveg és a szöveg Fotó: Jiménez et al.

98 százalék

Az adatbázis viszont önmagában még nem hozhat áttörést, ehhez a mesterséges intelligencia kell. Az ékírásban egy jelnek számos értelme lehet, de ahelyett, hogy ezt még mindig egy hozzáértőnek kellene elemeznie, jönnek a gépek. Egy friss, 20 ezer sorból álló minta alapján a mesterséges intelligencia 98 százalékos hatékonysággal tudta megállapítani, hogy mit jelenthetnek a jelek. Ez ahhoz képest egészen csodálatos eredmény, hogy a Gilgames elejének csak a 60 százalékában biztosak a kutatók – minden más csak találgatás.

Jiménez és társai, miközben optimisták, azért nem bíznak a csodafegyverben: a Gilgames elejét még így is számos forrásból állították össze, és amíg nincs rá több agyagtábla, ez így is marad. A régészek éppen abban bíznak, hogy az egyre több átfedés felfedezésével sikerül majd egyre több összefüggést is felfedezni a szövegek között, de a változatok közötti különségekben is akadhatnak érdekességek.

Gének és babilóniaiak

A Lajos-Miksa Egyetem kutatói a szövegváltozatok elemzéséhez használt algoritmust az egyetem génkutatóitól kapták kölcsön. Annak ellenére, hogy ezt az algoritmust kifejezetten az ékírásos szövegek felismerésére trenírozták, az alapja ugyanaz maradt, mint amit a génkutatók használtak, a módszer pedig ragyogóan bevált: a használatával több száz újonnan azonosított töredék került a helyére. Ahogy Jiménez mondja, az asszírológia eddigi 150 évében mintegy ötezer ismeretlen töredéket sikerült a helyére illeszteni, a mesterséges intelligencia használatával öt év alatt 1500 találta meg az új helyét, és több ezer olyan is akad, amit még nem tudtak megfelelően azonosítani, de már csak a kirakós többi darabja hiányzik.

Mindez egyelőre csak néhány őrült tudós játékának tűnhet, de nem az: az a Gilgames, amit mindenki hiányosan ismert, most már a mesterséges intelligenciának is köszönhetően minden eddiginél teljesebb formában férhető hozzá az erre érdeklődőknek. A Fragmentarium ráadásul egyre bővül, így aki tud babilóniaiul, akkádul, sumérul, az korlátlanul garázdálkodhat benne.

És hogy mit nyerünk ezzel? A kutatásból egyrészt kiderül, hogy mégis mi állhat a legősibb ismert írásos történetben, másrészt arra is fény derül, hogy a mesterséges intelligencia nem feltétlenül csak ahhoz használható, hogy optimalizálja az embernek a reklámokat a Facebookon.

Kapcsolódó cikkek a Qubiten:

link Forrás


link Forrás
link Forrás