Hogyan segíthet a mesterséges intelligencia abban, hogy minél kevesebben bukjanak ki a magyar egyetemekről?
A mesterséges intelligencia (AI) ma már nem pusztán a sci-fi filmek izgalmas világának kiegészítője, hanem a mindennapi valóság része, segítségével egyre több területen, egyre pontosabban jelezhetünk előre eseményeket és modellezhetünk folyamatokat. Az AI-eszközök ma már képesek akár megírni a házi feladatot vagy letenni az orvosi szakvizsgát, és aligha lep meg bárkit, hogy pusztán algoritmusokkal megjósolható az is, hogy megosztok-e majd egy álhírt a közösségi médiában vagy sem. A mesterséges intelligencia egyre jelentősebb mértékben hódít teret az egészségügyben is: kellően nagy adathalmazon végzett elemzésekkel számos betegség válik felismerhetővé, többek között azt is kimutathatjuk, hogy milyen védekezési módok tudnak igazán hatékonyak lenni a koronavírussal szemben, sőt társadalmi normák és etikai alapvetések megértésére is bevetették már.
Azokon a területeken, ahol megfelelően nagy adatmennyiség áll rendelkezésre, ott megjelenik az adattudomány, és munkába lép a mesterséges intelligencia és a gépi tanulási algoritmusok. Ilyen adatgazdag terület az oktatás világa is, ahol az egyik legfontosabb megoldandó probléma a végzési arány növelése a középiskolákban és az egyetemeken, vagyis a lemorzsolódás elleni küzdelem. Alapvető cél, hogy a rendszer idejében felismerje, kik azok, akik a kibukás szélére sodródtak, vagy hogy egyáltalán meg tudjuk mondani, mely tényezők vezethetnek a lemorzsolódáshoz.
A probléma igencsak aktuális, mivel a koronavírus-járvány idején megnőtt a lemorzsolódás a közoktatásban, amely különösen a hátrányos helyzetű és roma származású gyerekeket veszélyezteti. Az egyetemi kibukás kérdése pedig leginkább a mérnöki és természettudományos képzési területeket érinti, ugyanis ezeket a szakokat az Európai Unión belül a magyarországi egyetemeken végzik el az egyik legrosszabb arányban.
Vajon segíthet-e a lemorzsolódás elleni küzdelemben a tanulmányi adatok elemzése és a gépi tanulás? A válasz egyértelműen igen. A Műegyetemen működő Human & Social Data Science Laboratóriumban (HSDSLab) évek óta foglalkozunk adatvezérelt oktatáskutatással, többek között az egyetemi lemorzsolódás témájával. A felsőoktatásban használt Neptun elektronikus tanulmányi rendszer, amely minden hallgatóról számos adatot tárol, olyan gazdag adatkészletet biztosít, ami számos érdekes és kihívásokkal teli elemzést tartogat az adattudósoknak.
A középiskolai teljesítmény, a felvett kreditek száma és a kollégiumi lét is előre jelezheti az egyetemi sikereket
Az egyetemek részletes és értékes historikus adatokkal rendelkeznek a lemorzsolódással kapcsolatban, hiszen a korábbi évfolyamok esetén ismert, hogy mely hallgatók milyen tanulmányi eredménnyel végezték el az egyetemet, vagy éppen morzsolódtak le. Ezek a historikus adatok lehetővé teszik, hogy gépi tanulási modelleken keresztül megvizsgáljuk az összefüggéseket például a középiskolai tanulmányi teljesítmény (osztályzatok és érettségi eredmények) és az egyetemi sikeresség között.
A Műegyetem 2010 után beiratkozott hallgatóinak adatait vizsgálva arra jutottunk, hogy gépi tanulás segítségével már a felvétel pillanatában rendelkezésre álló adatok alapján eredményesen azonosíthatók a lemorzsolódásban veszélyeztetett hallgatók. A legjobban teljesítő algoritmusok kb. 80 százalékos pontossággal képesek megbecsülni a hallgatói sikerességet. Az elemzéseinkből az is kiderül, hogy önmagában a felvételi pontszám is meglehetősen jó prediktora a későbbi egyetemi teljesítménynek: minél magasabb pontszámmal vesznek fel valakit az egyetemre, annál valószínűbb, hogy sikerrel végzi majd el tanulmányait. Az érettségi és a felvételi között eltelt idő is jó indikátor: ha például több év is eltelt a két esemény között, akkor nagyobb a lemorzsolódás valószínűsége. Érdekes továbbá, hogy bár a vizsgálat műegyetemi hallgatókon alapult, mégis feltűnő a humán tárgyak fontossága. Azon hallgatók ugyanis, akik nemcsak a reál tárgyakból, hanem magyar nyelv és irodalomból, valamint történelemből is jó eredményt értek el, az egyetemet is nagyobb arányban végezték el.
Természetesen még tovább pontosíthatók a lemorzsolódásra vonatkozó előrejelzések, ha számításba vesszük az egyetemi elsőféléves eredményeket is – ilyen adatok például a felvett kreditek száma és a korrigált kreditindex. Szintén növelhető az előrejelzés pontossága és alkalmazhatósága a megfelelő modell kiválasztásával: a legutóbbi munkáinkban a legmodernebb gépi tanulási modellek alkalmazásával (neurális hálózatok, értelmezhető gépi tanulási módszerek), a hiperparaméterek optimalizálásával és a hiányzó adatok kezelésével még precízebb előrejelzéseket értünk el.
A hallgatói lemorzsolódásnak nyilvánvalóan számos kiváltó oka lehet, és nem csak a középiskolai vagy az elsőféléves tanulmányi eredményeken múlik. Kutató pszichológusokkal együttműködve például azt is megvizsgáltuk, hogy a személyiségjegyek mennyire befolyásolják az egyetemi sikerességet. Vannak-e olyan személyiségtípusok, amelyek sikeresebb tanulmányokat biztosítanak a felsőoktatásban? Az eredmények azt mutatták, hogy a pszichológiai mérőszámok figyelembevételével javítható a lemorzsolódásban veszélyeztetett hallgatók azonosításának pontossága. A legfontosabb tulajdonságnak a stresszel való megbirkózás képessége (coping) bizonyult – az egyetemi életre való áttérés számos megrázkódtatással jár, amit fontos megfelelően kezelni –, de általánosságban is elmondható, hogy a jó problémakezelési készség és a pozitív attitűd sokat segít az egyetemi élet során. Egy másik tanulmányban pedig azt találtuk, hogy a kollégiumi lét pozitív hatással van az egyetemi sikerességre.
Már a pályaválasztásban is segíthet az AI, de az adatok felhasználása etikai dilemmákat is felvet
Azoknál a kutatásoknál, ahol annyi személyes adatot használnak, mint a lemorzsolódás-előrejelzés során, szót kell ejteni a felmerülő etikai vonatkozásokról is. Kutatásaink során mindig kiemelt fontosságú volt a hallgatók anonimitásának megőrzése, valamint az adatok kezelése során a GDPR szabályoknak való megfelelés. Másrészről az sem teljesen egyértelmű, hogy a kapott eredményeket hogyan lehet etikus módon közölni a hallgatókkal. Az előrejelzések nyers eredményeinek közlése negatív önbeteljesítő jóslattá is válhatnak. Nyilvánvaló, hogy ha egy diákot a beiratkozás napján szembesítünk azzal, hogy a mesterséges intelligencia azt jósolja, hogy ő nagy valószínűséggel nem lesz sikeres az egyetemen, az nem az eredmények megfelelő felhasználása, hiszen könnyedén negatív irányba befolyásolhatja a hallgató tanuláshoz és az egyetemi karrierjéhez való hozzáállását. A cél viszont éppen ennek ellenkezője, a lemorzsolódásban veszélyeztetett hallgatók segítése, és a végzési arányok növelése.
Ha a felsőoktatási intézmények tudják, hogy mely hallgatókat veszélyeztetettek a lemorzsolódás tekintetében, támogathatják őket tanácsadással, felzárkóztató kurzusokkal, személyes mentorálással és személyiségfejlesztő tréningekkel. Sőt, a fenti eredmények akár már a középiskolások karriertervezését, pályaválasztását is segíthetik: a középiskolai eredmények alapján AI-eszközökkel ajánlás fogalmazható meg arra vonatkozóan, hogy milyen tudományterületen vagy egyetemi szakon tud a diák a legsikeresebb lenni. Ehhez kapcsolódóan a legutóbbi oktatási adattudományi kutatásunkban bemutattuk, hogyan tudják segíteni a felsőoktatás résztvevőit a magyarázható mesterséges intelligencia (XAI) eszközei, valamint hogy az egyéni előrejelzések magyarázata hogyan teszi lehetővé a személyre szabott visszajelzést és tanácsadást.
A lemorzsolódás természetesen nemcsak hazai probléma, világszerte kutatják a kérdést, és igyekeznek is tenni ellene. Az Egyesült Államokban, a tucsoni Arizonai Egyetemen a hallgatókról kártyás azonosító rendszerrel gyűjtenek adatokat, és azokat felhasználva készítenek előrejelzéseket, majd vezetnek be intézkedéseket. Nem akármilyen mélységű adatgyűjtésről van szó: a diákok csaknem hétszáz helyen használják a kártyát, a kávéautomatáktól a könyvtárakon keresztül a kollégiumi szobákig. Ezekből az adatokból nemcsak az látható, hogy melyik hallgató mikor merre járt, de nagy valószínűséggel arra is következtetni lehet, hogy kikkel barátkozik, hogyan változik az ismerőseinek köre. Az ilyesféle adatgyűjtés persze már nagyon komoly erkölcsi aggályokat vet fel, és ezeket az elért változás sem igazolhatja: a szoros nyomkövetés eredménye mindössze szűk három százalékos javulás lett a megtartott elsőévesek számában.
Az egyetemi hallgatók megtartásáért folyó harcban mindenesetre még nincs itt a totális megfigyelés korszaka: a legtöbb tudományos folyóirat általában olyan cikkeket közöl, amelyekben a felvételi és egyetemi eredményeket veszik számításba a kutatás során. A HSDSLab kutatási eredményeiből is látható, hogy már ezen adatok alapján is eredményesen azonosíthatók a lemorzsolódásban veszélyeztetett hallgatók, akiknek aztán személyre szabott segítséget lehet nyújtani.
A szerző adattudós, a Budapesti Műszaki és Gazdaságtudományi Egyetem Sztochasztika Tanszékének doktorandusza.