Lehet, hogy az AI világuralomra tör, de egyelőre még egy nyomorult neandervölgyit se tud lerajzolni

február 10.
majom
  • Link másolása
  • Facebook
  • X (Twitter)
  • Tumblr
  • LinkedIn

Szőröshátú majom üldögél egy fa árnyékában, és szeretettel bámul a kezében lobogó tűzgömbre. Mögötte egy szakállas nő (?) kék otthonkában egy kosárnyi csont között válogat, mellettük egy ízléses nádtetős kerthelyiségben szőrtelen hátú férfiak iszogatnak. A tűzvarázsló mögött több kosárnyi gumó található, a háttérben egy határozott homlokereszű szakács hosszú, ősz seggszőrrel valami ételt készít a prehisztorikus tűzhelyen. A mulatozók mellett a földön valamiért egy súlyzó tárcsája található.

Különös életkép
Fotó: Magnani, M., & Clindaniel, J., Advances in Archaeological Practice (2025)

Így képzeli el a mesterséges intelligencia a neandervölgyiek hétköznapi életét, legalábbis egy nemrégiben megjelent kutatás szerint. Ez még csak az első verzió: a kutatók két alapszituációról és két alaposabban promptolt élethelyzetről akartak képet kinyerni a DALL-E-3-ból, mérsékelt sikerrel, ugyanis még a képek javított változatain is lenne mit csiszolni, a mesterséges intelligencia ugyanis makacsul ragaszkodik néhány olyan tereptárgyhoz, amelyeknek semmi keresnivalójuk a neandervölgyieknél. Ilyen például a fonott kosár is, a súlyzótárcsát vagy egy másik képen felbukkanó biciklikerékszerű valamit inkább hagyjuk is. A képeken üvegből vagy fémből készült szerszámok is szerepelnek, és persze a neandervölgyiek sem úgy néznek ki rajtuk, ahogy az újabb kutatások szerint valószínűleg kinéztek.

Balról jobbra: finomított promptokkal, hétköznapi igényességgel; finomított promptokkal, valósághűen; általános életkép és realisztikus általános életkép
Fotó: Magnani, M., & Clindaniel, J., Advances in Archaeological Practice (2025)

A szöveg se sokkal jobb

A kutatók nem elégedtek meg a képekkel, szöveget is generáltattak, ehhez a ChatGPT 3,5-öt használták. A szövegek sem sikerültek sokkal jobban, mint a képek: ezekből is egy hétköznapi leírást és egy tudományos igényű összefoglalót kértek. Ezekben is szerepeltek tévedések, a nyelvi modell a neandervölgyiek lakhatási körülményeiről kezdett hallucinálni – de úgy tűnt, hogy mást hallucinál a képalkotó, és mást a szövegíró AI.

A szövegben az 1960-as évekből származó források domináltak, a képi világ pedig a ‘80-as és a ‘90-es évek stílusában készültek. Közös pont volt rajtuk, hogy nőket és gyerekeket csak elvétve ábrázoltak, a neandervölgyieket pedig sokkal majomszerűbbnek mutatták be, mint amilyenek valójában lehettek. Ez meg is felel annak, ahogy a különböző korokban tekintettek a neandervölgyiekre: az elsődleges forrásként használt anyagokban alig foglalkoztak a szociális vagy családi életükkel, az újabb források viszont gyakran fizetőfal mögött találhatóak, így azok hiányoztak is a téma feldolgozásából.

Ez Matthew Magnani és Jon Clindaniel antropológusok, a tanulmány szerzői szerint hosszabb távon még nagyobb zűrt is okozhat: miközben egyre többen használják a mesterséges intelligenciát tanulásra is, a chatbot és a képgeneráló eredményeit is erősen torzítják az elavult információk és a paywall mögötti cikkek, ez pedig egy újabb érv a szabad hozzáférésű publikációk mellett és a jelenlegi akadémiai publikációs gyakorlatok ellen.