50 magyar egyetemi oktatót kérdeztünk arról, hogy mi lesz itt, ha a hallgatók robottal íratják meg a házi feladatot
A mesterséges intelligencia (MI, angolul AI) rohamos fejlődéséről legalább a 2010-es évek óta rengeteget hallani, de csak az elmúlt egy-két évben jutottunk el odáig, hogy már a hétköznapi felhasználók is kihasználhatják az algoritmusok és a gigantikus szöveges adatbázisokon tanított nagy nyelvi modellek képességeit. Miközben az internetet meghódították az egyszerű kulcsszavak alapján élethű képeket gyártó algoritmusok (DALL-E 2, Midjourney, Stable Diffusion), a nyelvi modellek sztárja kétségkívül az OpenAI nevű kutatócég által fejlesztett, kísértetiesen emberszerű szövegek alkotására is képes GPT-3 lett.
2022-ben egyébként is új fejezet nyílt a mesterséges intelligenciát használó nyelvi alkalmazások történetében. A Google testvércége, a DeepMind januárban jelentette, hogy Gopher nevű, 280 milliárd nyelvi paraméterből építkező modellje szövegértésben eljutott egy középiskolás diák szintjére, júniusban pedig a Google saját, LaMDA nevű modelljére épített chatbot győzte meg a vállalat egyik mérnökét arról, hogy öntudatra ébredt, bár ezt a legtöbb szakértő erős kétkedéssel fogadta.
Szeptemberre odáig fajult a dolog, hogy a Redditen megjelentek az első olyan posztok, amelyekben diákok vágnak fel azzal, hogy mesterséges intelligenciával íratják a házi dolgozataikat és esszéiket. Egy 17 éves norvég diák szerint például a tanárok kérdés nélkül osztogatják az 5-ösöket a – legfeljebb is csak alig módosított – gépi szövegekre, ráadásul arról is beszámolt, hogy néhány hét alatt 100 dollárt keresett azzal, hogy osztálytársainak házi feladatait is megíratta a GPT-3-mal.
Az év legvégére még nagyobb fokozatba kapcsolt az AI-alapú szöveggyártás: az OpenAI decemberre kiadta a legfrissebb nyelvi modelljére (GPT3.5) épülő chatbotot, a ChatGPT-t, amelynek ingyenesen elérhető online felületén öt nap alatt elérték az egymillió regisztrált felhasználót. Miközben mindenkit az izgat, hogy az internet szinte teljes tudásanyagát pillanatok alatt kiaknázni képes AI milyen emberi munkákat tesz feleslegessé, egyelőre annyi vált biztossá, hogy az életszerű beszélgetéseket lebonyolító chatbot hosszú távon kiválthatja az internetes keresőmotorokat, hiszen az esetenként nehezen megadható keresési kulcsszavak helyett csak egyszerű kérdéseket kell neki feltenni, amire akár vázlatos formában, akár társalgási nyelvezetben képes választ adni.
Mivel a ChatGPT-ről rövid idő alatt kiderült, hogy a korábban látottaknál sokkal hatékonyabban képes összegezni egy megadott téma legfontosabb elemeit, és további kérdezősködésre akár a részletekbe is belemegy, ráadásul mindezt a kért stílusban teszi (ha akarjuk, verset ír Szókratész tanaiból, ha arra kérjük, pontokba szedi a szociálpszichológia legfőbb irányzatait és azok ismérveit), jogosan merült fel a kérdés, hogy van-e értelme ezentúl fogalmazásokat, esszéket, házi dolgozatokat íratni a diákokkal. Ahogy Corry Wang, a Google kutatója írta Twitteren a ChatGPT-ről: „Valós időben nézzük végig az egyetemi esszék halálát.”
A legfelkészültebb egyetemi oktatók maguk próbálták ki, hogyan teljesítene a ChatGPT egy általuk kiadott írásos feladattal, de az eredmények egyelőre nagyon változatosak. A kanadai McGill Egyetem pszicholingvisztika-professzora, Daniel Lametti egy harmadéves hallgatóknak szánt feladatban arra kérte az algoritmust, hogy írja le a nyelv és a színérzékelés közötti kapcsolat lényegét, de a gép a válasza alapján megbukott volna a teszten. Az Arizonai Állami Egyetem újságírást tanító professzora, Dan Gillmor már nagyobb sikerről számolt be: hallgatói után a chatbotot is arra kérte, hogy írjon egy levelet, amelyben az online biztonsággal és adatvédelemmel kapcsolatban ad tanácsokat egy rokonának. A kapott dolgozatról így nyilatkozott: „Jó értékelést adtam volna rá. Az oktatásnak komoly problémával kell szembenéznie.”
Az új technológiák az oktatás célját kérdőjelezik meg
Hogy valamennyire felmérjük a magyar helyzetet, 50 egyetemi oktatónak küldtünk kérdéseket arról, hogy ismerik-e ezeket az eszközöket, hallottak-e már arról, hogy a hallgatók ilyenek segítségével írták meg házi dolgozataikat vagy beadandó esszéiket (esetleg tapasztaltak-e ilyesmit első kézből), illetve hogy tartanak-e a technológiától és terveznek-e változtatni az írásos számonkérés módszerein. Az ötvenből négy nap alatt 23-an válaszoltak – főként bölcsészkari, jogi és társadalomtudományos, vagyis olyan szakokról, ahol a leginkább támaszkodnak az olyan típusú beadandó dolgozatokra, amilyeneket akár már egy chatbot is meg tud írni.
Rögtönzött, reprezentatívnak távolról sem mondható közvélemény-kutatásunkból kiderült, hogy az érintett oktatók többsége már hallott az életszerű szövegeket generáló AI-eszközökről, nagyobb részük magáról a ChatGPT-ről is, de egyelőre nem tartanak a képességeiktől, és nem is hallottak olyanról, hogy valaki az intézményükben használt volna már ilyet házi dolgozatok megírására – legfeljebb mesterséges intelligenciára alapuló fordítóprogramokat, például a DeepL-t.
Abban is egyetértés alakult ki a magyar egyetemi oktatók között, hogy a szöveggenerátorokat ugyan teljes értékű esszék megírására még – legalábbis magyar nyelven – nem igazán lehet felhasználni, azok a hatékony szövegalkotásban a hallgatók segítségére lehetnek. Hamp Gábor kommunikációkutató, a BME Szociológia és Kommunikáció Tanszékének egyetemi docense például a következőt válaszolta kérdéseinkre:
„Nem annyira tartok tőlük, mint inkább azt gondolom, hogy elkerülhetetlenül itt vannak ezek az eszközök mindennapi használatra nagyon rövid időn belül. Nem gondolom, hogy értelmét vesztené az esszéírás. Az esszéforma a tudományos minőségbiztosításnak bevált eszköze. Elképzeléseket jól strukturáltan megfogalmazni a gondolkodás egy formája, szerintem nem érdemes feladni ezt az eszközt. Viszont érdemes kihasználni azt a lehetőséget, amit az MI kínál abban, hogy jobb szövegeket állíthassunk elő. Azt gondolom, hogy az oktatásban ezeket a munkát, a tanulást, a kutatást segítő eszközökként kell kezelnünk, és a pedagógiai feladat az, hogy a technológia konstruktív használatára tanítsunk. Azokon a kurzusaimon, ahol a szövegírás kitüntetetten szerepel, ott én viszem be ezeket az eszközöket, ahol technológiai fókuszú a kurzus, ott pedig szeretnék open source szoftvereket használni. Az általam ismert szoftverek magyarul pontatlanok, és sokkal inkább szerkezeti, stiláris segítséget tudnak adni a munkához. De nem lehet megspórolni az elmélyülést.”
Mráz Attila, ELTE BTK Filozófia Intézetének egyetemi adjunktusa elmondása szerint időnként kipróbálja, hol tart a mesterséges intelligencia a szövegalkotás terén, de a magyar nyelvű válaszok az ő területén egyelőre nem túl meggyőzők: „Összetett fogalomhasználatot, érvelést, az ismeretek új alkalmazását kívánó feladatokra válaszképp inkább legfeljebb középiskolai szinten elfogadható válaszokat kapok – egyelőre.” Szerinte minőségében nem is igazán újkeletű az a probléma, amit a fejlett chatbotok állítanak az oktatók elé, hiszen „a technológiai fejlődés már régóta újra és újra annak az átgondolására késztet minket, hogy mit tekintünk értékes tudásnak, készségeknek. Ez a probléma persze egyáltalán nem csak az esszéfeladatok esetében merül fel. A tesztkérdések és más, főként tárgyi ismeretek egyszerű visszaidézésére, rekonstruálására irányuló feladatok értelme is más volt egy olyan korban, amikor a számon kért ismeretek nem voltak két kattintásnyira elérhetőek. Fontos látni, hogy egyik esetben sem pusztán egy oktatásmódszertani, technikai problémáról van szó, ami a hatékony számonkérés mikéntjére vonatkozik. Ennél sokkal érdekesebb kihívásról van szó. A kérdés nem egyszerűen az, hogy hogyan kérjünk számon, hanem hogy mi az, amit egy adott közegben továbbra is értékes tudásként, ismeretként, készségként egyáltalán érdemes számon kérnünk. Vagyis az oktatás célját kérdőjelezik meg a technológiai fejlesztések, ami szintén nem újdonság: teljes más ismeretek, készségek, attitűdök elsajátítása volt értelmes cél az ipari forradalom előtt és után, vagy az 1980-as években és most. A felsőoktatásban is felül kell vizsgálni a célokat.”
Mráz szerint a tantermi számonkérésektől az otthon elvégzendő esszéfeladatokig soha nem lehet abból kiindulni, hogy a hallgatók mindenáron ki akarják aknázni az összes csalási lehetőséget, ezért a számonkéréseknek a minimális bizalomra kell épülniük. Ezért „ha olyan feladatokat adunk ki, amelyeknek a hallgatók érzik és értik az értelmét, és mind nekik, mind pedig az oktatóiknak olyan körülményeket biztosítunk, amelyek között lehetséges ilyen feladatokat végezni és végeztetni, akkor lesz okunk bízni abban, hogy a nehezebb, kihívást jelentő feladatokat is becsülettel végzik. Nem arra kell koncentrálni, hogy a csalásra alkalmas technológiák mellé minél jobb csendőr-technológiát vagy csendőrpedagógiát alkalmazzunk, hanem arra, hogy az értelmes hallgatói és oktatói munkavégzés feltételei adottak legyenek, és akkor a bizalom és a tisztességes munkavégzés, értékelés kultúrája is megerősíthető.”
A legfőbb probléma azonban szerinte nem a technológiából ered, hanem abból, „ha az oktatónak nincs ideje, lehetősége több szöveges feladat egyikeként íratni esszét, s így egy-egy hallgató útját végigkövetni, vagy ha az oktatónak olyan mennyiségű hallgató írásait kell egyedül értékelnie, ami már nem teszi lehetővé az egyéni stílusjegyek felismerését. Ebből megint csak az következik, hogy elsősorban a felsőoktatás körülményein kell javítani. Hiszen nincs abban semmi különösebben meglepő (akármit is gondolunk erről erkölcsileg), hogy az a hallgató lesz a leginkább elkötelezett az egyedi szellemi alkotások előállítása iránt, aki a munkájára irányuló, egyedi szellemi alkotást megillető figyelmet kap.”
A jog még túl bonyolult az AI-nak
A beadandó dolgozatok műfaját szintén előszeretettel használó jogi oktatásban sem tartanak attól, hogy az algoritmusok képesek lennének a jogszabályok ismeretében megfelelő következtetésekre jutni, és érvényes válaszokat adni. Mint Mezei Péter, a Szegedi Tudományegyetem Állam- és Jogtudományi Kar Összehasonlító Jogi és Jogelméleti Intézetének egyetemi tanára írta válaszában: „Bár előszeretettel adok ki írásbeli házi dolgozati feladatokat, azonban azok hipotetikus jogi példák (gyakran vizuális elemekkel megtámogatva), amelyekre a hallgatónak - ideális esetben - a félév során elsajátított ismeretek (jogszabályok, jogesetek, jogpolitikai gondolatok és egyéb elemzések, továbbá statisztikák) mentén kellene logikus, jogilag is helytálló érvelés mentén válaszokat adniuk. Az MI alkalmas az egyszerűbb összefüggések kiváló átlátására (így pl. a statisztikák, adatok elemzésére), de nem láttam még olyan szöveggenerátort, ami a különböző jogi tartalmakat egy adott keretrendszeren belül (itt: a konkrét kurzus keretei között) értelmes esszévé gyúrnák össze. Mindezt lábjegyzetekkel ellátva, hogy a hallgatót ne érhesse plágiumvád se (mármint a forrásmegjelölések elmaradása miatt).”
Karsai Krisztina, a szegedi jogi karon büntetőjogi tantárgyakat tanító professzor sem tart a nyelvi modellek mai képességeitől, de szerinte „szükséges lehet átgondolni az írásbeli házifeladatok célját és feladatát. Alighanem az olyan feladatok, amelyek azt a célt szolgálják, hogy a diák egy adott témakörben tárja fel és szintetizálja a szakirodalmat, jelentőségüket fogják veszteni. Miközben egyébként a lényeges információk kiszűrése, keretbe foglalása, összefüggések felismerése bizonyos mértékig szakmai készségnek is tekintendő, amelyet egyébként fejleszteni kell.” Karsai szerint ugyanakkor a jogesetek megoldását igénylő feladatok esetében még egy jó darabig nem várható, hogy az algoritmusok jól teljesítsenek, mert „a jogszabályok konkrét esetekre történő alkalmazása több olyan tényezőt is megkövetel, amely nem »matematizálhatók«, illetve a nyelvi modellek sem alkalmazhatók jó eredménnyel az ilyen típusú jogi szövegekre. Nem zárom ki azonban, hogy lesznek ilyen fejlesztések.”
Az SZTE ÁJK Összehasonlító Jogi és Jogelméleti Intézetének adjunktusa, Molnár András szerint pillanatnyilag a plagizálás és az igénytelen szövegmásolások kiszűrése nagyobb prioritást élvez az AI alkotta szövegek észlelésénél, ugyanis egyelőre ezek a módszerek dominálnak az írásbeli feladatok teljesítése során. Mint elmondta, az általa is tanított tárgyakban egy viszonylag komplex teljesítési módszert alkalmaznak, ahol a szóbeli és írásbeli feladatok egyaránt feltételei a teljesítésnek. Itt a feldolgozott téma „szóbeli számonkérése nyújthat segítséget annak kiszűrésében, hogy mennyire történt valódi önálló munka, illetve mennyire csak egy gép által kiadott feladat lett beadva.” Molnár szerint viszont „érdemes lehet azt is fontolóra venni, hogy mik azok a feladatok, amelyeket a hallgatók nyugodtan rábízhatnak az MI-re (főleg a nagy tömegű adatfeldolgozásra, illetve a rutinfeladatokra gondolok), és mi az, ahol jobban elvárható a saját szellemi erőbefektetés (elsősorban a kreatív, önállóságot igénylő feladatoknál).”
A fiatalabbak inkább hajlamosak a csalásra, de az előbb vagy utóbb visszaüt
Fekete Mariann, az SZTE Bölcsészettudományi Kar Szociológia Tanszékének adjunktusa kiemelte, hogy bár nem hallott még olyanról, hogy magyar nyelven ilyen eszközöket használtak volna hallgatói, azt „tudomásul kell venni, a fiatalok digitális skilljei jóval fejlettebbek és összetettebek, mint az egyetemi oktatók jelentős hányadáé, sokkal érdeklődőbben, nyitottabban és befogadóbban viszonyulnak a technológiai újításokhoz is, mint az idősebb nemzedékek. Mindezek mellett, ha még előnyöket is kínál egy új technológiai megoldás, értelemszerűen ki fogják használni, főként az oktatás és a számonkérés terén.” Ennek alátámasztására egy online fókuszcsoportos kutatásból („Generációk azonosítása Big Data logikával a poszt-pandémiás időszakban”, kutatásvezetők: Böcskei Balázs, Fekete Mariann, Nagy Ádám és Szabó Andrea) is idézett két jellemző választ, amelyben gimnáziumi tanulók mondták el tapasztalataikat az online oktatásról:
- „...mert azért itt jobban lehetett cselezni mondjuk a dolgozatok alatt, akár hogy ha összecsatlakoztunk, hogy együtt megcsináljuk, akár ha a feleléseknél, mondhatjuk, hogy könnyebb volt, mint személyesen.”
- „...Tanulni tényleg nagyon nem tanultunk, mert nagyon könnyű volt kicselezni mindenféle rendszert, amit a tanárok próbáltak ellehetetleníteni, de nem ment nekik. Én egyáltalán nem tanultam ebben az időszakban.”
Nagy Alíz, az ELTE Társadalomtudományi Karának politikatudományi tárgyakat oktató adjunktusa egyetért kollégáival abban, hogy a legégetőbb problémát egyelőre a plágiumot kikerülő, a bemásolt szöveget szoftveresen szinonimákkal helyettesítő és átfogalmazó eszközök jelentik. Nagy az újfajta technológiák terjedésével is legfeljebb annyit változtatna a számonkérési módszerein, hogy a szakdolgozathoz hasonlóan a klasszikus félév végi beadandókat is meg kelljen védeniük szóban a hallgatóknak. Azonban úgy látja, hogy ha a hallgatók az AI segítségével helyettesítik a gyakorlást, akkor az az ő dolguk, a végén úgysem lesznek igazán mély akadémiai ismereteik. „Engem nem zavar, hogy lesz, aki ezt nem látja be és az MI, vagy bármilyen egyéb segítség által jut előre. Lehet, hogy ez naivitás, de azt gondolom, hogy előbb vagy utóbb, de legkésőbb a munkaerő piacon, úgyis kiderül, hogy nem tud saját erejéből boldogulni.”
Tófalvy Tamás kultúrakutató, a BME Szociológia és Kommunikáció Tanszékének egyetemi docense ugyan lehetségesnek tartja, hogy eljön az a korszak, amikor már nem gondolják fontosnak az írásos feladatokat, de ő személy szerint ettől egyáltalán nem tart. Erre két okot jelölt meg:
„Az egyik ok strukturális, azaz nem biztos, hogy minden úgy alakul, ahogy most látjuk. Jelenleg még nem ez a helyzet, és az akár közeljövő technológiai fejleményeiről érdemes óvatosan beszélni. Amikor a közbeszédben felkapott technológiák hirtelen tényezővé válnak a gondolkodásunkban (vagy akár a piacon), az egyáltalán nem garantálja azt, hogy később is meghatározók maradnak, vagy ha igen, ugyanazok maradnak a hozzá kapcsolt kulturális elvárások, értékek. Ugyanígy fordítva: nagyon hirtelen tudunk befogadni olyan technológiákat, amelyekről korábban nem csak azt nem gondoltuk hogy fontos lehetnek, hanem azt sem, hogy létezhetnek. Az első variációra lehet példa az ember távoli galaxisokba való eljuttatásának víziója, ami korszakokat határozott meg az emberi gondolkodásban, a második pedig az internet mai formája és szerepe – amiről gyakorlatilag senki sem ábrándozott korábban. A másik ok morális: azaz tartani olyan dologtól lehet, amiről azt feltételezzük, hogy rossz, de az sem biztos, hogy ha tényleg bekövetkezik, az valóban »rossz« lesz. A kreativitás, eredetiség, teljesítmény és hasonló fogalmak mindig egy adott kulturális-technológiai ökoszisztémában kapnak szerepet, jelentést, és ezen keretek között vitatjuk meg őket. Tehát ha elértéktelenedik az előre megírt digitális szöveg értéke, akkor másfelé fognak mozogni az elvárás és a teljesítés koordinátarendszerei: vagy más típusú szövegekre lesz szükség, vagy más típusú, mondjuk analóg bevitelre – vagy éppen nem szövegekre, hanem valami teljesen másra.”
Mindenesetre a felhasználói szintű AI-alkalmazásoknál már megszokhattuk, hogy a ahol potenciálisan visszaélésekre van esély, ott párhuzamosan azok kiküszöbölésén is dolgoznak – legfeljebb nem ugyanolyan léptékben. Az interneten elérhető legismertebb OpenAI-detektor egyelőre a GPT-2 modell által alkotott szövegek felismerésére képes viszonylag megbízhatóan, miközben a GPT-3 és a ChatGPT szövegei minden egyes utasításra vagy kérdésre egy kicsit másképp fogalmazza meg a válaszait, és a fejlesztői sem teljesen értik, hogy mi alapján. Az OpenAI jobb híján a chatbot szövegeinek digitális vízjelezésével kísérletezik, de az egyelőre nem világos, hogy ezt miért ne lehetne kikerülni a kapott szöveg egyszerű újrafogalmazásával.
Kapcsolódó cikkek a Qubiten: