A ChatGPT átírja a tudományos publikálás játékszabályait – de milyen áron?

Az egyre népszerűbb és egyre szélesebb körben használt nagy nyelvi modellek (LLM), mint például a ChatGPT, a DeepSeek AI vagy a Gemini, képesek nyelvi feladatok ellátására, így például szövegek generálására, fordítására, szerkesztésére és összegzésére. Ez a képességük nemcsak hétköznapi kommunikációra ad lehetőséget, hanem a különböző munkafolyamatokat is felgyorsíthatja és megkönnyítheti, és ez a jelenség már a természet- és humán tudományok publikálási szokásaiban is megfigyelhető – rohamosan növekszik azoknak a publikációknak a száma, amelyek az LLM-ek természetéből fakadó torzításokkal, az általuk erősődő cikkgyárak megjelenésével vagy a téma etikai vonatkozásaival foglalkoznak. Egy 2024-es tanulmány szerint, amely a 2022. december és 2023. február közötti időszakra fókuszált, a vizsgált 45 000 absztrakt több mint 10 százaléka ChatGPT-vel lett íratva, míg a Nature hasonló témájú felmérése szerint a Dimensions nevű adatbázis 2023-ban megjelent cikkeinek több mint 1 százaléka, vagyis legalább 60 000 valamilyen mértékben chatbotok felhasználásával készült. Azóta ez a szám feltehetőleg csak növekedett. Bár a téma nem kifejezetten területspecifikus, mivel a természettudományok területén is számos, ám bizonyos mértékben eltérő kérdést vet fel a mesterséges intelligencia (MI) használata, ebben a cikkben főként a humán tudományok példáján keresztül világítok rá ezeknek a gyakorlatoknak néhány fő problémájára.

Arra, hogy miért támaszkodik egyre több kutató ezen eszközök használatára, részben a publikálási rendszer sajátosságaiban kell keresni a választ. A publish or perish (magyarul nagyjából „publikálj, vagy szívódj fel”) kultúrájában nem meglepő, hogy rengeteg kutató érzi a nyomást azzal kapcsolatban, hogy többet kellene publikálnia. A publikálás – és főleg a kreatív munka – azonban nem algoritmizálható, hanem periodikus és kiszámíthatatlan, amely tulajdonságok nem kedveznek a konstans elvárásokkal küzdő akadémiai rendszer résztvevőinek.

Ezeket a cikkeket double-blind peer review, vagyis referált és kettős vak bírálati rendszerben bírálják el, ami az akadémiai lét egyik legfontosabb minőségbiztosítási mechanizmusa. Ennek értelmében a publikálásra szánt tanulmányt a folyóirat szerkesztője által felkért bírálók ellenőrzik anélkül, hogy tudnák, ki írta a szöveget, majd javaslatot tesznek arra, hogy a munka megfelel-e az adott terület sztenderdjeinek, illetve tartalmaz-e hozzáadott értéket, amellyel a diszciplínát gazdagítja. Ennek az úgynevezett hozzáadott értéknek azonban egyes tudományágak esetében nem annyira egyszerű a megítélése, így ez a minőségbiztosítási mechanizmus is nehézségekbe ütközhet. Mindezt nehezíti meg most még jobban a mesterséges intelligencia növekvő mértékű használata.

A publikálási rendszer problémás mivolta persze a szakmában dolgozók előtt nem titok: a nagy kiadók felfoghatatlan összegeket keresnek azokon a munkákon, amit a szerzők és sokszor a szerkesztők is fizetség nélkül végeznek el. Mégis elkerülhetetlen, hogy aki álláshoz akar jutni, pályázatot akar nyerni, illetve kutatói karrierre vágyik, az így vagy úgy elfogadja a gyakran kiszámíthatatlan és hosszadalmas bírálati folyamatokat. Így a publikálásnak egzisztenciális tétje is van, a szó mindenféle értelmében.

A fentiek miatt sokan kritizálják a rendszert, ráadásul az sincs sztenderdizálva, hogy mennyi az annyi: kinek, mennyit, milyen helyeken illik publikálni? Ha a természet- és humán tudományok eltérő publikálási hagyományait, a különböző karrierstádiumok, intézményi elvárások és publikálási kultúrák eltérő irányait is figyelembe akarjuk venni, még bonyolultabbá válik a helyzet. Míg egyes doktori iskolákban, például angolszász területeken, a doktorandusz hallgatóknak egyáltalán nem kell publikálniuk, máshol elvárás, hogy már ők is cikkeket jelentessenek meg. Így nem ritka, hogy publikálás tekintetében egy fiatal kutató esetenként még túl is szárnyalhatja azokat az idősebb kollégákat, akikkel szemben vagy mások az elvárások, vagy a pozíció adta kényelemből fakadóan kevésbé feszített tempójú publikálással is elketyegnek a szakmában.

A publikálás tehát mind a humán, mind a természettudományos területeken a kutatói lét elengedhetetlen része, ennek ellenére egy több szempontból is sanyargatott gyakorlattá vált, miközben a nyomás egyre csak nő a kutatókon. A bölcsészettudományokon belül ráadásul mégiscsak szükséges valamilyen belső motiváció is az íráshoz, legyen szó akár referált folyóiratokban megjelenő tanulmányokról, akár populárisabb hangvételű cikkekről. Mindez azonban olyan helyről kapott most még egy léket, amely eleinte nemhogy nem ártó szándékúnak tűnt, hanem egyenesen a terheket csökkentő égi áldásnak, ugyanis látszólag könnyít a publikálás terhein.

A generatív mesterséges intelligencia, mint amilyen például a ChatGPT, elsősorban úgy jelenik meg a közbeszédben, ami bár hasznos tud lenni, de bizonyos munkákat veszélyeztet, jelentős környezeti károkat okoz, és alapjaiban változtatja meg az oktatást – legalábbis a számonkérések tekintetében biztosan. Számos kollégával beszélgettem erről, és nem reprezentatív vizsgálódásom eredménye az lett, hogy egymással szöges ellentétben álló vélemények keringenek a szakmán belül azzal kapcsolatban, hogy miként alakítja át a publikálási szokásokat az MI. Segít átvészelni a kreatív válságot, és az üres papír bámulásának szorongását is egy csapásra meg tudja oldani? Megtoldja a lassan szaporodó karakterek számát, így segít a publikációs nyomás enyhítésén, vagy túlhasználat esetén etikátlan versenyelőnyhöz juttat és rombolja a publikálás presztízsét? Amennyiben az utóbbi a helyzet, mit jelent a túlhasználat, és mikortól válik etikátlanná az eszköz használata?

Egyes kutatók úgy érzik, hogy ezek az eszközök segítenek nekik abban, hogy azzal foglalkozzanak, ami a szakmájuk művelésében számukra a legizgalmasabb, így lekerül róluk az a teher, amit kevésbé szeretnek benne. Ebben az esetben a kellemes munka az ötletek kitalálását jelenti, a kellemetlen pedig ezek kidolgozását, és a mechanikusabb munkák elvégzését. Vagyis ha megszületik a kutató fejében egy gondolat, vagy felismer egy problémát, ellentmondást vagy vakfoltot, amelynek kibontásában segít az MI, akkor az már a szakma művelésének egy formája lehet. Még annak ellenére is, hogy a szöveget nem a kutató ujjai pötyögik be a laptopon a szövegszerkesztő programba, hanem az MI találja ki a struktúrát, írja meg a szakirodalmi összefoglalót, segít az érvek megfogalmazásában, rávilágít hiányosságokra, majd ezekből összeilleszti a cikket. Ezek lennének a fenti példában a mechanikusabb munkák, feltéve persze, hogy egyáltalán elképzelhető a különböző munkáknak a diszkrét elválasztása. Az alapgondolat tehát a szerzőé, a kivitelezés pedig többé-kevésbé a megfelelő utasítások segítségével a mesterséges intelligencia feladata lesz. Persze a promptok adekvátsága, vagyis az, hogy hogyan irányítjuk az MI-t, nagyban befolyásolja az elkészült cikket is, de erről még később szó lesz.

Azonban mindezek nyomán kérdésessé válik a szerzőség: ki a szerzője azoknak a cikkeknek, amelyekben (1) az ötlet a kutatóé, de a ChatGPT írja meg a szöveget promptok alapján, (2) az ötletet is a ChatGPT kínálja fel, és az is írja meg, (3) az ötletet a ChatGPT adja, de a kutató a mesterséges intelligencia segítsége nélkül írja meg a cikket. Nézzük meg a problémát a saját területemen, a filozófián keresztül!

Valószínűleg a (3) a legkevésbé gyakori opció: ha már az ötlettelenségben szenvedő kutató kap egy ajándék gondolatot, akkor nehezen elképzelhető, hogy utána egyáltalán ne venné igénybe az MI által nyújtott előnyöket, legalább minimális mértékben. Abban persze a kutatók többsége egyetért, hogy például a bibliográfia ellenőrzésére, a szöveg helyenkénti csiszolására, a nyelvhelyesség ellenőrzésére teljesen elfogadható az MI használata. Védhetőnek tűnik, hogy ugyan az ötletet az MI adja, az ezzel utána foglalkozó, az ötletet kidolgozó, a szakirodalmat feldolgozó és cikké formáló író éppen filozófiát is művelhet. Kérdés továbbá, hogy szükséges és elégséges feltételnek tartjuk-e a filozófia művelésének szempontjából azt, hogy az ötlet is a szerzőtől származzon: amennyiben igen, úgy nincs filozófiacsinálás anélkül, hogy az ötlet ne a szerzőtől eredne, ha viszont nem, akkor a fentebb említett mechanikus munka fogalma lesz aláaknázva. A (2) nehezen védhető álláspont lenne azoknak, akik amellett próbálnak érvelni, hogy a szerzőség továbbra is a filozófust illeti meg, és színtiszta filozófiai munkáról van szó ilyen esetekben is. Ahhoz, hogy ez érvényes álláspont legyen, a filozófia fogalmának valamilyen radikális átalakítására lenne szükség, ami képes lenne arra, hogy továbbra is filozófiának tartson mindent, amit eddig annak tartottunk, és a mesterséges intelligencia által tömeggyártott szövegeket is valamilyen kritérium alapján filozófiának minősítse. Ha azonban ezt megtesszük, hirtelen a személyes kutatói lét, valamint a publikálási rendszer alapjaiban rendül meg: ebben az esetben nem emberek által írt szövegeket bírálnak a folyóiratok, majd publikálnak szerzők a saját nevük alatt filozófia címen, erőforrásokat is igényelve mindezekre. A folyóiratok többsége ráadásul deklarálja, hogy a szerzők vagy nem használhatnak a cikkekben MI által generált szövegeket, vagy pedig fel kell tüntetni, hogy azokban mely részeket készítette MI. Így elképzelhető, hogy hamarosan a ChatGPT lesz a legnagyobb impaktfaktorral rendelkező szerző. Azonban továbbra is problémát jelent az MI által generált szövegek megbízható detektálása, így – legalábbis részben – a kutatók lelkiismeretére van bízva a dolog.

Marad tehát az (1) opció, amelyről valószínűsíteni lehet, hogy a leggyakoribb eset. Gipsz Jakabnak feltűnik, hogy érdemes lenne megvizsgálni, Polányi Mihály nézetei vajon relevánsak-e az MI kapcsán. Ezután ahelyett, hogy a sztenderd módokon munkához látna (cikkeket, könyveket keres a témában, újraolvassa a Személyes tudást, beszélget a kollégáival, beleássa magát a téma bugyraiba), megkéri a ChatGPT-t, hogy keressen potenciálisan ehhez kapcsolható jeleket Polányi szövegeiben, segítsen neki összerakni egy érvelést, gyűjtse össze a releváns szakirodalmat, majd az elkészült szöveget megkritizáltatja a ChatGPT-vel, és így csiszolja tovább az MI által írt munkát az MI. Ezek a szövegek aztán egyre hasonlóbbak lesznek egymáshoz – vannak például olyan kifejezések, amelyekről ordít, hogy a ChatGPT írta őket. Előfordulhat persze, hogy a folyamat során a szerző akár ellent is mondhat az MI-nek, és felülbírálja bizonyos érveit, vagy áthelyez bekezdéseket, hozzáad más irodalmakat is, de alapvetően a szöveget nem a szerző írja.

Itt vissza is kanyarodunk tehát a bekezdés fő problémájához, a szerzőség kérdéséhez, ami végső soron összefonódik azzal is, hogy mit gondolunk a filozófiacsinálás feltételeiről. Ha a filozófia egy inherensen emberi csinálmány, akkor attól függően eltérő konklúziók felé fogunk terelődni, hogy ezt egy eldöntendő, vagy fokozati kérdésnek tartjuk. Emellett sajnos azt sem kerülhetjük meg, hogy elmélázzunk a metafilozófia klasszikus kérdésén, vagyis azon, hogy vajon mitől lesz filozófia a filozófia, ettől azonban most a terjedelmi korlátok miatt megkímélem az olvasót. Egy rövid mondat erejéig mégis muszáj jeleznem, hogy erről a kérdésről a filozófusok is eltérően gondolkodnak, pláne ha figyelembe vesszük a filozófia heterogén összetételét.

A szerzőség kérdése mellett ráadásul egyéb problémák is felmerülnek, amelyek innen-onnan tépázzák az akadémiai publikálás amúgy sem fényes rendszerét. Sokak szerint ugyanis az, hogy egy olyan eszköznek rendeljük alá magunkat, amelynek a működéséről valójában nem sok fogalmunk van, visszavonhatatlanul károsítja először a publikált cikkek minőségét és mélységét, majd ezek nyomán szépen lassan erodálja egyfelől a tudomány és az akadémiai publikálás étoszát, végül pedig azt, hogy mit tartunk valódi, konszenzusosan elfogadott sztenderdek mentén elbírált jó munkának. Az ugyanis, hogy a ChatGPT milyen elvek mentén priorizál bizonyos érveket, érvtípusokat, témaköröket és elképzeléseket, nagy eséllyel rejtve marad a cikket szerző filozófus előtt. Így tehát egy olyan black boxszal van dolgunk, amelynek belső működéséről egyfelől csak sejtésünk lehet, másfelől pedig a nagyvállalati logikát nem mellőző mérnökök döntései nyomán születnek előre nehezen meghatározható algoritmusok alapján. Így szükségszerűen alá fogjuk rendelni a kutatói munkát egy olyan ágensnek, ami nagyrészt tőlünk független, ám döntései ilyen-olyan irányba terelgetik a gondolkodásunkat.

Nem mellőzhető továbbá annak a jelentősége sem, hogy egy cikk – jó esetben – valamilyen hozzáadott új tudást tartalmaz. A ChatGPT viszont erre képtelen: abból tud dolgozni, ami már létezik, azt fogja összegyűjteni és összefoglalni, ráadásul a legfrissebb és a fizetős cikkekhez hozzáférése sincs. Ha a filozófiacsinálás szükséges feltétele az, hogy újat hozzunk létre, akkor nem fogunk tudni valódi filozófiát művelni az MI segítségével, de képesek lehetünk rá akkor, ha az ötlet új és a sajátunk ebben az esetben viszont más problémák merülnek fel (lásd fentebb).

Mindez egy értékátrendeződést, a pesszimistábbak szerint szerint pedig egyenesen morális válságot hoz el. Elveszítheti ezáltal az akadémiai publikálás a presztízsét, ráadásul az akadémiai karrier klasszikus előrehaladási irányát is újraírhatja, mivel a korábbiaktól különböző képességeken fog múlni az előrehaladás. Egyes vélemények szerint egyenesen hátrányba kerülhetnek azok a kutatók, akik maguk találják ki ötleteiket, és maguk is írják meg azokat, vagy maximum az elkészült szövegen csiszoltatnak az MI segítségével, mivel ez sokkal időigényesebb módszer. Ellenben azok, akik keményen megdolgoztatják a ChatGPT-t a havi előfizetésért cserébe, akár hetente leadhatnak egy újabb cikket top folyóiratokba, amelyek közül akár több át is mehet a szűrőn, ami előrehaladást hozhat a karrierjükben. Mindez ráadásul a generált cikkek iszonyatos mennyisége miatt még több feladatot ró a folyóiratok szerkesztőire és bírálóira, ami végeredményben a sztenderd módon publikálók újabb károsítását, és az eleve nehézkes publikációs rendszer újabb problémáját is jelenti.

Vannak olyan gyakorlatok, amelyek totálisan szembe mennek explicit szabályozásokkal, mint például a generatív MI nem feltüntetett használata, teljes cikkek ezzel való megíratása, és az adatok meghamisítása és generálása. Vannak emellett olyan, az MI természetéből fakadó egyéb problémák is, amelyek erodálják a cikkek minőségét, mint például az MI hallucináció által okozott álhivatkozások jelenléte a szakirodalmi áttekintőkben. Összességében azonban a mesterséges intelligencia túlzott mértékű, kritikátlan használata olyan szürkezóna, amelynek „lebuktatására” egyelőre a technológia természetéből fakadóan nincs megbízható, sztenderdizált eszköz. A téma morális vonatkozásai tekintetében pedig egyelőre csak intuícióinkra támaszkodhatunk, mindenki saját belátása szerint. Jelenleg úgy fest, hogy ezen gyakorlatok mentén kénytelenek leszünk újragondolni az akadémiai publikálás szabályrendszerét, és kitalálni, hogy mik azok a sztenderdek, amelyek biztosíthatják a minőséget, és amelyek etikai szempontból is elfogadhatóak.

A szerző az MTA Lendület Értékek és Tudomány Kutatócsoport tagja és a BME Filozófia és Tudománytörténet Tanszék adjunktusa.