Kopje koffie, avagy a hollandok esete a kicsinyítéssel
Akinek van tapasztalat a holland nyelvvel, tudhatja, hogy a hollandok imádják a kicsinyítő képzőket. Nem mintha mindig cukiskodnának vagy odalennének a pici dolgokért. De amikor egy csésze kávét kérnek vagy kínálnak, akkor kop koffie –`csésze kávé' – helyett mégis igen gyakran azt mondják, hogy kopje koffie –`csészécske kávé'. Ilyenkor valójában ezzel nem a csésze, hanem a kérés vagy a szívesség nagyságát csökkentik. Olyan ez, mint amikor az indulatunkat egy becsmérlő jelző beiktatásával jelezzük (én most egy finom változatot fogok használni, de tetszés szerint durvítható): Add már oda azt a rohadt banánt a majomnak! Vagy: Add már oda a banánt annak a rohadt majomnak! Sem a banánra, sem a majomra nem kell haragudnunk, hogy ilyeneket mondjunk, egyiknek se kell „rohadtnak” lennie, egyszerűen ez az egyik módja annak, hogy az indulatunkat, türelmetlenségünket, elégedetlenségünket stb. kifejezzük.
De mindennek vajmi kevés köze van ahhoz, amiről beszélni szeretnék. A holland kicsinyítő képzőknek más érdekességük is van, méghozzá az, hogy sokféle van belőlük, és hogy milyen szóhoz milyen képzőt lehet rakni, annak nagyon bonyolult szabályai vannak. Ha egyáltalán beszélhetünk „szabályokról”, mert annyi „kivétel” van, hogy ha megkérdezzük egy hollandtól, hogy mi egy szó kicsinyítős alakja, lehet, hogy elbizonytalanodik, és nem biztos a válaszban. A gyakori szavakról persze tudja: kop ∼ kopje `csésze', hap ∼ hapje `falat', ezek nyilvánvalóak, mert folyton előfordulnak, és általában a -p-re végződő szavak után leggyakrabban -je a kicsinyítő képző (bár a kip `csirke' a kipje mellett lehet kipetje is). Ritka szavaknál néha a hangzás alapján egyértelmű, hogy milyen a kicsinyítő alak, néha meg nem. Tipikusan olyan eset ez, amikor a nyelvtanban felállíthatunk egy tucat szabályt, de mindegyik alól lesz kivétel, és a legtöbb kivétel alól is lesz.
És akkor az 1990-es években egy Walter Daelemans nevű belga nyelvész (akkor Hollandiában, a Tilburgi Egyetemen dolgozott) az Antal van den Bosch nevű kollégájával nekiesett a holland kicsinyítő képzők megfejtésének. (Mellékes megjegyzés: Daelemans nevét egyszerűen [dálemansz]-nak ejtjük magyarul, mert az ae a magyar [á]-hoz hasonló hang régies írásmódja, ami személynevekben maradt fenn, Bosch nevét meg [bosz]-nak, mert a szó végén az sch-t [sz]-nek ejtik. Ez a bosch is egy régi írásmódot őriz: az `erdő' jelentésű szót írták így régen, ma már bos-nak írják.) Abból indultak ki, hogy bár a ritkább szavak esetében a beszélők bizonytalanok, és más-más beszélők más-más kicsinyítős alakot találják a legvalószínűbbnek, azért az jól érezhető, hogy olyan stratégiát alkalmaznak, hogy minél jobban hasonlít a ritka (vagy akár soha nem hallott) szó egy gyakori szóra, annál valószínűbb, hogy a gyakori szóhoz járuló kicsinyítő képzőt fogják használni. Tehát például amikor megjelent a top mint ruhadarab, akkor azonnal mindenki topje-nek kezdte hívni (mondtam, hogy imádják a kicsinyítő képzőket), de már a sip (angol szó, `korty' a jelentése) esetében már a sipetje is előfordul (a kipetje `csirke' mintájára).
A nyelvészek régesrégen ismerték ezt a jelenséget, a 19. századtól analógiának nevezték (mert az egyik kifejezést más kifejezések hasonlatosságára, analógiájára alkotunk meg). A nyelvhasználatban rengeteg helyen megfigyelhető ez a jelenség, sőt, egyes nyelvészek szerint (például szerintem) ez a legalapvetőbb elv, ami a nyelvhasználatunkat vezérli. Szóval nem ez volt az újdonság, hanem az, hogy ennek az analógiás gondolkodásnak a folyamatát matematikai eszközökkel sikerült modellálniuk, számítógépes programot is írtak rá, és a program meglepően jól utánozta az anyanyelvi beszélők teljesítményét a kicsinyítő képzős alakok megalkotásában (beleértve a bizonytalankodásukat is).
Daelamansék tulajdonképpen nagyon egyszerűen oldották meg a problémát. Egy adatbázisban eltárolták rengeteg gyakori szónak a felépítését (elég egyszerűen ábrázolva) és a kicsinyítő képzős alakját, maga a program pedig, amikor egy új szót kellett kicsinyítő alakban előállítania, összehasonlította az új szót az adatbázisban levőkkel, és az új szóhoz leginkább hasonlító szavak leggyakoribb kicsinyítő alakjának a mintájára megalkotta az új szó kicsinyítő alakját. Ez volt a nyelvészetben az első alkalom, hogy a valóban kreatív nyelvhasználat mechanizmusát életszerűen sikerült utánozni.
Analógiás gondolkodás
Első látásra az az eljárás, amit a holland kicsinyítő képzőkre vonatkozóan Daelemansék megragadtak, nem hasonlít azokra, amikről korábban a természetes és mesterséges intelligenciával kapcsolatban beszéltem. Lehet benne része az alakfelismerésnek és az osztályozásnak, de ennél többről van szó: egy új jelenségben felismerünk régebben tapasztaltakhoz való hasonlóságokat, és új jelenséget hozunk létre azoknak a régebbieknek a felhasználásával. Minél nagyobb a hasonlóság a régebbi tapasztalatunkhoz (és minél élénkebben, gyorsabban stb. fel tudjuk idézni azt a régi tapasztalatot), annál nagyobb esélye lesz annak a korábbi élménynek arra, hogy részt vegyen az új képződmény létrehozásában. Ezt az általános mechanizmust nevezzük analógiás okoskodásnak, amit már igazi gondolkodásnak nevezhetünk, mert a legváltozatosabb problémák megoldásában sikerrel használható. Ha a rendszerünk ezt tudja, akkor már talán joggal nevezhetjük intelligensnek.
Az analógiás gondolkodás egészen más, mint ahogy hagyományosan a logikus gondolkodást elképzeltük. A logikus gondolkodásban állítások láncolataival dolgozunk, úgy, hogy a lánc egyik szeméből mindig levezethető legyen a következő, és hosszú út vezet a kiinduló állításoktól a konklúzióig. (Ez akkor is így van, ha deduktívan gondolkozunk, vagyis keressük, hogy a premisszákból, a kiinduló állításokból adódik-e egy konklúzió, meg akkor is, amikor abduktívan, vagyis egy konklúzióhoz keresünk olyan premisszákat, amikből következik.) Az analógiás gondolkodás nem ilyen, ebben nem láncsszerűen rendezzük el a sok állítást (korábban megismert megoldási módokat), hanem inkább „széltében” sorakoztatjuk fel őket, és akár egy lépésben jutunk el belőlük az új probléma megoldásához.
Például állítólag a már korábban is emlegetett orvosi szakértelmet is így használják az orvosok. Az orvosoknak ritkán van dolguk események hosszú láncolatával, amit vissza kellene fejteniük, vagy legalábbis ritkán gondolkoznak ilyen módon. Inkább rengeteg korábbi esetükre emlékeznek (még ha nem tudják is őket egyenként felidézni, az emléknyomaik valamilyen formában felidézhetők), és ezeket szinte egyidejűleg felidézve hozzájuk hasonlítják az aktuális betegük tüneteit, majd a korábban sikeresnek bizonyult terápiákból szintetizálják az új javallatot. (Ezért szokás azt mondani, hogy az idősebb orvosokban jobban megbízhatunk: nagyobb az „adatbázisuk”.)
Hasonló példaként szokták említeni az angolszász országokból ismert esetjog (precedensjog) működését. Ebben is az történik, hogy az új eset megítélését a régi esetekkel való hasonlósága és a régi ítéletek alapján alakítják ki, bár itt kisebb szerepe van annak, hogy mennyire gyakoriak a különböző precedensek. Az esetjogi okoskodás abban is eltér az orvosi gondolkodástól, hogy ez nem hosszú logikai láncolatokat helyettesít (ahogy az orvosi érvelésben elvileg meg lehetne tenni, hogy különböző biokémiai és élettani folyamatokat követünk végig).
Viszont a nyelvhasználatban érvényesülő analógiás gondolkodás egészen párhuzamos az orvosi gyakorlatban megfigyelhetővel, egy fontos különbséggel. Itt is az a helyzet, hogy a hagyományos felfogás szerint lépésről lépésre rakjuk össze a mondatainkat minimális elemekből (vagy szedjük szét ilyenekre, és úgy értjük meg őket), vagyis egyfajta logikai levezetést csinálunk végig. Az új felfogás szerint viszont rengeteg korábbi szóalakra, kifejezésre, mondatszerkezetre emlékszünk, és arra is, hogy melyiket mire használták korábban, és amikor egy újat akarunk alkotni (valamire használni) vagy megérteni (megfejteni, hogy mire akarta használni a megalkotója), akkor a korábbi tapasztalatokból állítjuk össze az új megoldást (akár az új kifejezést, amit végül kimondunk, akár az újonnan hallottak értelmezését). Persze a különbség az, hogy itt két ellenkező irány létezik, a kifejezések megalkotása és a megértésük, míg az orvosi gondolkodásban mindig az egészségügyi probléma a kiindulópont, és a terápia kialakítása a cél.
Hogy működik ez?
Ha közelebbről megnézzük Daelemansék eredményét, kiderül, hogy az ő módszerük valójában nagyon egyszerű volt, és nagyon hasonlított azokra az adatbányászati eszközökre, amikről egyszer már írtam itt. Valójában annyi történt, hogy a holland szótöveket sok dimenzió mentén számokkal jellemezték (itt a szótagszerkezetre, a hangok egymásutánjára, ilyesmire kell gondolni), és az így keletkezett vektorokhoz egy plusz dimenzióként hozzáadták, hogy a lehetséges kicsinyítő végződések közül melyik szó melyiket választhatja. Ezek alkották a korábbról ismert esetek adatbázisát. Az újítás annyi volt, hogy a vektorok automatikus osztályozásánál, a dimenziószámuk csökkentésénél külön kezelték a „problémát” (a szótöveket) és a „megoldásukat” (a képzőt). Így a rendszerük valójában azokat a szabályszerűségeket tanulja meg, amik a szótő felépítése és a választott képző között megfigyelhetők. (Persze ezek a szabályszerűségek nem szabályok, egyrészt mert az érvényességük csak tendenciaszerű, statisztikai természetű, másrészt pedig mert a szokásos szabályokkal szemben igen nehéz lenne őket tömören, pláne emberi nyelven megfogalmazni.)
Vagyis a kicsinyítő képzők „kiszámításánál” teljesen hiányzik az a mozzanat, hogy a korábbi megoldások különböző elemeiből kell új megoldást szintetizálni. Márpedig az igazi analógiás gondolkodásnál erre van szükség. Azon a számtalan területen, ahol analógiás modelleket használnak, sokkal bonyolultabb feladatokat kell megoldani, mint a kicsinyítő képzők kiválasztása, és sokkal bonyolultabban kell magukat az adatbázisokat is felépíteni. Például használnak ilyen rendszereket nemcsak a jogi és az orvosi szakértelem automatikus utánzására, hanem halászati, hardvergyártási és még számtalan más célra is. Területenként más és más módon kell ábrázolni a megjegyzett korábbi eseteket és a megoldásokat, mást és mást jelent a hasonlóság a korábbi esetekhez, és másképpen kell a korábbi megoldásokat kombinálni ahhoz, hogy az új probléma megoldására javaslatot készítsenek. És mindezekhez a mesterséges intelligencia egyéb eszközeit is felhasználják (amilyenekről korábban már írtam), például a hasonlóságok felismerésére az alakfelismerő módszereket, az esetek osztályozására az osztályozó módszereket.
Mindebből az a tanulság, hogy a mesterséges intelligencia (beleértve a nyelvhasználati képesség modellálását is) jelenleg abba az irányba halad, hogy nem hosszú logikai levezetésekkel jutnak el problémák megoldásához, hanem inkább egymástól eltérő képességek modelljeit (felismerés, osztályozás, analógia) építik egymásra, és az egyes modellek önmagukban gyakorlatilag egy lépésben hoznak döntéseket. Ugyanakkor az is jellemző erre az irányra, hogy a tudást nem néhány nagyon általános alapelv és néhány nagyon általános logikai szabály ismeretével azonosítják, hanem inkább esetek, mérések, tapasztalatok hatalmas tömegével ábrázolják.
A szerző nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa. A Qubit.hu-n megjelent írásai itt olvashatók.