„Az embereknek egyelőre sokkal jobb ötleteik vannak, mint a gépeknek” – az AI-ról szólt a 12. Qubit Live
- Link másolása
- X (Twitter)
- Tumblr
„Három évvel ezelőtt nyáron volt egy tábor a diákokkal. Akkor még nem volt ChatGPT, tehát azt mutattam meg a diákoknak, hogy hogyan tudják a nyelvi modelleket használni programozással. Nem tudott magyarul sem beszélni. Akkor nem tippeltem volna meg, hogy a GPT nem sokkal később elkezd folyékonyan magyarul kommunikálni” – mondta Huszár Ferenc mérnökinformatikus, a Cambridge-i Egyetem tanára és az egyik legidézettebb magyar AI-kutató a szerdán megrendezett 12. Qubit Live-on.
Az azóta eltelt három évben eljutottunk odáig, hogy a magyarok kétharmada – a GKI Gazdaságkutató Zrt. idén júliusi felmérése szerint – már használt mesterséges intelligenciát (AI), a diákok 90 százaléka pedig már tanulmányaiban is hasznosította a gépi tudást. Bár a technológia fejlődése Huszár szerint őrülten gyors és komoly mértékű volt az elmúlt években, az AI általános képességeiben a következő 5-10 évben már nem nagyon várható javulás, inkább az egyes részterületeken, például a matematikában vagy a programozásban szárnyalhatja túl jelentősen az emberi képességeket. Ahogy ő fogalmazott: „Azt a maradék pár százalékot, ami ahhoz kell, hogy ne válaszoljon őrületes butaságokat nagyon egyszerű kérdésekre, amikor az ember beszélget vele, azt nagyon sokáig fog tartani megoldani.”
A megértés megértése
A margitszigeti Kristály Színtéren a Qubit+ előfizetőinek tartott esten az AI főbb kutatási irányaival, korlátaival és társadalmi kockázataival foglalkoztunk vezető magyar kutatók részvételével. A rendezvényt a Qubit lapigazgatója, Kövesvári Krisztián nyitotta meg, majd az esemény támogatója, az Amundi Alapkezelő Zrt. részéről Vízkeleti Sándor köszöntötte a mintegy 200 fős közönséget.
Jakovác Antalra, a HUN-REN Wigner Fizikai Kutatóközpont Adat- és Számításintenzív Tudományok Kutatócsoportjának vezetőjére hárult a feladat, hogy az első néhány percben összefoglalja, az életünk mennyi területét meghódította a mesterséges intelligencia az elmúlt években. A szövegek generálására, beszélgetésre, fordításra alkalmas chatbotok mellett már a kép-, videó- vagy zenegenerátorok is beszivárogtak a mindennapokba, de a kutyafajtákat vagy madárhangokat felismerő applikációk vagy az okostelefonok arcfelismerő képessége is sokaknak ismerős lehet. Ráadásul ezeket a funkciókat már részben a multimodális modellekre épülő legújabb chatbotok is integrálták, például jó esetben a ChatGPT is pillanatok alatt meg tudja mondani egy fotóról, hogy azon őzlábgomba vagy párducgalóca látható.
Bár az AI ma már sok területen meghaladja az emberi intelligenciát, más területeken meglepően alulteljesít. Hiába rendelkezik a ChatGPT „olyan nagy tudással, amellyel egyetlen, Földön élő ember sem”, a beszélgetések során egyszerű kérdésekre is hallucinál (hamis információkat közöl, vagy rosszindulatúbban: hazudik), és például az önvezető autók fejlődése is azért akadozik, mert az autópályán még mindig nem tudja elég jól megkülönböztetni egymástól a különböző objektumokat.
Ennek legfőbb oka, hogy alapvetően különbözik egymástól az emberi és a gépi problémamegoldás. Míg az ember a probléma megértésével kezdi a folyamatot, majd erre építve dolgoz ki megoldási stratégiát, addig a mesterséges intelligencia esetében a „megértés megértésére” van szükség – vagyis annak feltárására, hogyan is működik maga a megértés folyamata. Az AI a környezeti jelenségekre jellemzően közvetlen, gyors és intuitív reakciókat ad, de sokkal kevésbé képes a belső modellek kialakítására, a következmények mérlegelésére és a tudatos, logikus döntéshozatalra.
Jakovác szerint ez tulajdonképpen azt jelenti, hogy az AI nem gondolkodik, hanem inkább „érez”, vagyis az állati-növényi reakciókhoz hasonlóan ösztönösen cselekszik. Míg egy ember képes egyszerre több dolgot csinálni, tehát több komplex feladatot egyszerre elvégezni (például autóvezetés közben beszélgetni), addig az AI jellemzően egy-egy konkrét feladatot old meg, és nincs belső modellje, amely lehetővé tenné a párhuzamos, tudatos tervezést vagy a döntések következményeinek előrejelzését. Emiatt bár gyors és pontos lehet egy jól körülhatárolt problémában, könnyen hibázik, ha a helyzet váratlan, összetett vagy kontextusfüggő.
ChatPULI és a Pannon Puma
Azt több előadó is jelezte, hogy amikor a közbeszédben mesterséges intelligenciáról beszélünk, valójában nagy nyelvi modellekről (LLM) van szó – ezek képzik a chatbotok alapját. A nagy techcégeknek általában megvannak a saját fejlesztésű, általában különböző internetes szövegeken betanított modelljeik, amiket az egyes felhasználók a felhőn keresztül, távoli szerverekről érnek el és vehetnek használatba. Ahogy Huszár Ferenc is említette, ezek hamar megtanultak egész jól beszélni különböző nyelveken, így magyarul is – akkor mégis mi értelme lehet külön magyar LLM-et fejleszteni?
Merthogy erre több oldalról is van igény. Palkovics László mesterséges intelligenciáért felelős kormánybiztos például nemzeti érdeknek nevezte a magyar nyelvű AI-rendszerek fejlesztését, de ipari oldalról is hasonlót fogalmaztak meg technológiai befektetők és vállalkozók, akik szerint „a digitális nyelvi szuverenitás nem grandiózus ambíció, hanem kulturális szükségszerűség”. A Qubit Live második előadója, Ligeti-Nagy Noémi alkalmazott nyelvész elmondta, hiába beszél egész jól magyarul a ChatGPT, ami még egy Petőfi-versből is jól tud idézni, két szempontból valóban fontos a saját, magyar nyelvű modell fejlesztése.
Az egyik szempont a biztonság, hiszen egy saját szerveren futtatott nyelvi modell esetén jobban kontroll alatt lehet tartani, hogy ki férjen hozzá az adatokhoz, amelyek magyar cégek vagy állami hivatalok adatai esetén érzékenyek is lehetnek. Így a visszaélések és az adatlopás kockázata is kisebb, ráadásul a külföldi felhőszolgáltatóknak, szerverhibáknak sincs kitéve a modell. Másfelől egy saját modellnél mi dönthetjük el, milyen adatokból tanuljon, vagyis nem véletlenszerű, interneten talált szövegekből tanulja meg értelmezni a nyelvet, hanem válogatott, minőségi anyagokat lehet betáplálni, vagy olyan szövegeket, amik nem elérhetők az interneten.
Ligeti-Nagy, a nemrég az ELTE-hez csatolt Nyelvtudományi Kutatóközpont Nyelvtechnológiai Kutatócsoportjának vezetője elmondta, hogy már létezik is ilyen magyar nyelvi modell: a Puli, és annak chatbot változata, a Puli Chat. Igaz, míg a mai legismertebb nyelvi modellek több ezer milliárd szóból tanultak, addig a teljes magyar internet kb. 60 milliárd szóból áll. Ezt aztán meg kell tisztítani (ki kell szűrni az ismétléseket, javítani a hibákat), a modellt szuperszámítógépen be kell tanítani, majd a korpuszt finomhangolni kell, hogy használható és értelmes legyen. Ehhez több mint százmillió szót felölelő beszélgetésre van szükség, és ez bizony emberi munka – Ligeti-Nagy szerint ez hátráltatja leginkább a Puli fejlődését, hiszen ezt a rengeteg munkaórát meg is kell fizetni.
De már így is egész okos a ChatPULI: a kutató által bemutatott példában annyit kértek a chatbottól, hogy írjon egy magyar szuperhősfilmet, és az egyből elő is állt a Pannon Puma című sztorival, szerelmi szállal, főgonosszal és sok-sok ármánnyal.
A tudósokat segíti, de nem helyettesítheti
A közelmúlt AI-forradalma a tudományt is elérte, a 2024-es kémiai Nobel-díjat például részben a Google DeepMind vezetője, Demis Hassabis és a cég AI-kutatója, John Jumper kapta az AlphaFold2 algoritmus megalkotásáért, amely megoldotta a fehérjék háromdimenziós szerkezetének meghatározását. Gáspári Zoltán, a Pázmány Péter Katolikus Egyetem bioinformatikus tanára és az MTA doktora előadásában bemutatta, hogy bár az AlphaFold teljesítménye lenyűgöző, az algoritmusnak csak szakértő kezekben van igazi haszna, és nem váltja ki az emberi munkát.
A fehérjeszerkezetek megismerése kulcsfontosságú egy sor területen, hiszen enélkül nem jöhetett volna létre számos gyógyszer vagy oltás (például a Karikó-féle covidvakcina sem), de a PET-palackok lebontására alkalmas enzimek megtalálásához is szükségesek ezek az ismeretek. Márpedig nagyságrendekkel több fehérjét ismernek a tudósok, mint amennyiről szerkezeti információ is a rendelkezésükre áll. Gáspári szerint a fehérjék szerkezetének meghatározásával foglalkozó kutatók közössége évtizedekig úgy működött, hogy kétévente konferenciákon megbeszélték, mire jutottak, és szépen lassan haladt a dolog előre. Aztán „bejön a DeepMind 2018-ban, és két év múlva mindenkit megvernek ebben. Azok, akik nem foglalkoztak eddig ezzel, jobbat csinálnak, mint azok, akik 20 éve csak ezzel foglalkoznak”.
A későbbi kerekasztal-beszélgetésen Tóth András kollégánk kérdésére, hogy az AI mennyire használható a tudományos területeken, Gáspári így fogalmazott: „Kutatóként úgy tekintek az AlphaFoldra, ami hipotéziseket generál, tehát tud nekem mondani olyan lehetséges állapotokat, amiket tudok tesztelni kísérletesen. Tehát mond egy tippet, hogy hogy néz ki egy szerkezet, és én meg tudom mondani, hogy ez kompatibilis-e azokkal a mérésekkel, amiket el tudok végezni. És erre nagyon jó, mert sok olyan tippet tud mondani, amiket más módszerekkel nem biztos, hogy olyan könnyen elő tudok állítani.” Ugyanakkor kiemelte, hogy a kísérletes megerősítést ugyanúgy el kell végezni, ráadásul például a gyógyszerfejlesztések legnehezebb része a klinikai vizsgálatok lefolytatása és az engedélyeztetési folyamat, amiben a mesterséges intelligencia – egyelőre – nem tud segíteni.
Az AGI megjelenése nem képesség, hanem bizalom kérdése
Huszár Ferenc, aki a már említett titulusai mellett a Twitter korábbi fejlesztője is, beszédes Venn-diagramokkal érzékeltette a természetes és a gépi intelligenciával megoldható feladatok viszonyának változását az évek során. Míg 2010-ben a közös halmazban már ott volt egy sakkjátszma lejátszása, a bábuk felismerése és mozgatása, vagy mondjuk egy go-játszma megoldása még kizárólag emberi kompetencia volt. Öt évvel később már utóbbiak is a közös halmazba kerültek, hiszen a gépi látás fejlődése lehetővé tette a különböző objektumok felismerését, a robotikai fejlesztések megoldották a bábuk mozgatását, valamint az AI is fejlődött annyit, hogy a DeepMind AlphaGo algoritmusa a sakknál jóval bonyolultabb goval is elboldogult.
Maradtak a kizárólagos emberi kompetenciák között olyan dolgok, mint a nyelvhasználat vagy a matematikai feladatok megoldása. Most, tíz évvel később már ezek is a közös halmazban vannak, és ahogy fogynak a csak emberek által megoldható feladatok, úgy bővülnek azok, amiket csak gépek tudnak elvégezni – a fehérjetervezés vagy a fúziós erőművek plazmaszabályozásához már kevés az emberi agy.
Míg 2020 előtt a gépi intelligencia természete nagyon specializált volt, vagyis egy-egy algoritmus általában egy-egy feladat (sakkozás, szövegfordítás, arcfelismerés, stb.) elvégzésére volt alkalmas, addig a mai, nyelvi alapú AI-rendszerek egyre inkább az emberi intelligenciára hasonlítanak. A különböző modelleknek ugyanúgy megvan egy nagy közös halmazuk az általános kompetenciákkal, mint az embereknek, és ugyanúgy jobbak egy-egy területen, mint az emberek – Józsi a matekhoz ért jobban, Kati meg a zongorázáshoz, ugyanúgy AlphaJózsi is a matematikai feladatokra specializálódott, KatiGPT-t pedig inkább a programozáshoz lehet használni.
A mesterséges általános intelligencia (AGI) várható megjelenéséről Huszár azt mondta, hogy mivel már a definícióját is rosszul fogalmazzuk meg, így valójában nem az a kérdés, hogy a gép mikor szárnyalja túl az emberi képességeket minden kognitív feladatban, hiszen a nem vagy nehezen mérhető és definiálható feladatokban (jog, háború, klímaváltozás) a sikert sem lehet mérni. Sokkal fontosabb az, hogy mikor döntünk úgy, hogy az egyszerűbb, mérhetőbb feladatokban elért sikerek láttán mikor döntünk úgy, hogy nagyobb kérdésekben is megbízunk a gép döntéseiben. De ez még messze lehet, hiszen – ahogy azt a kerekasztal-beszélgetésen elmondta – az AI egyelőre memóriagondokkal küzd: „A chatbotok egyelőre úgy működnek, hogy mindig, amikor új beszélgetést kezdeményezünk vele, olyan, mint amikor Csipkerózsikát felébresztjük az álmából. Beszélgetünk vele, visszamegy aludni, aztán semmire nem emlékszik. Így nagyon nehéz neki eltervezni a világuralomra törést, hogy csak ilyen kis epizódokban kommunikál.”
Improvizációs AI-terápia
Ahogy az lenni szokott, azt estén zenei kíséret és a tematikához kapcsolódó művészi előadás is volt – előbbi DJ Nora Matisse jóvoltából, míg utóbbit ezúttal a Berlinalén 2021-ben Ezüst Medve díjat nyert Kizlinger Lilla szolgáltatta, aki a szélesebb közönségnek a Magyarázat mindenre című filmből lehet ismerős leginkább. A színész egy AI-színházi improvizációt mutatott be, amelyben egy progamozó segítségével előre betanított chatbottal beszélgetett, amelyet terapeuta személyiséggel ruháztak fel. Kizlinger elmondta, a kísérlet ötlete onnan jött, hogy sokszor ő is és a környezetében lévők is használják az AI-t terápiás jelleggel és különböző magánéleti problémákkal a gépet kérdezik meg szakember helyett. „Néha segít, néha nem. Sok szempontból lehet romboló, de segíthet is” – mondta.
Kizlinger egy laptop előtt ülve mondta a promptokat a chatbotnak, amely hanggal válaszolt – és tanulságos módon egyből bemutatta a technológia korlátait. Az hagyján, hogy először más személyiség hangján szólalt meg, de amikor már zajlott az AI-terápia, sokszor összefolytak a szavai – aki használta már a chatbotok hangos funkcióit, ismerheti ezt a problémát, ami olyan, mintha összeakadna a gép nyelve, így nehéz érteni, amit mond. Máskor jól lehetett érteni a szavakat, épp csak értelme nem sok volt, vagy épp nem arra a kérdésre válaszolt, amit Kizlinger feltett neki. A dolgot az is nehezíti, hogy folyamatosan, megállás nélkül kell beszéli a gépnek, különben közbeszól. Mindezek ellenére néha meglepően jó válaszokat is kapott az AI-terápiára vállalkozó színész, de az előadás tanulsága mégiscsak az volt, hogy egyelőre nem érdemes a gépre bízni az életünket – még a lelki életünket sem.
Az előadást követő kerekasztal-beszélgetés után végül a nézők kérdezhettek a kutatóktól. A kérdések az AI legkülönbözőbb alkalmazásaira irányultak: hogyan használják fel a háborúkban, hogy áll a művészettel, vagy mikor állhat elő világmegváltó felfedezésekkel.
Az este utolsó nyilvános kérdése arra vonatkozott, hogy látnak-e az előadók potenciált a mesterséges intelligencia evolúciós jellegű fejlődésében. Jakovác elmondta, hogy vannak erre próbálkozások, például az összekapcsolt videós-hangos-szöveges ágensekből több információt lehet kinyerni, de a rendszerszintű gondolkodás még ugyanúgy nincs meg bennük. Huszár pedig úgy felelt, hogy az eddigi eredmények azt mutatják, „a kutatók által megtervezett AI-architektúrák jobban működnek, mint azok, amiket ilyen véletlenszerű evolúciós algoritmuskereséssel találtunk”. Tehát az embereknek egyelőre sokkal jobb ötleteik vannak, mint a gépeknek.
Az estet az Amundi Alapkezelő Zrt. támogatta. Amundi-befektetésekkel Te is részese lehetsz az AI-forradalomnak! (x)