A nyelv leírására létezik jobb módszer, mint szabályok tízezreinek felállítása

2020.10.03. · tudomány

Legutóbb vázlatosan elmondtam, hogy miért tartom a nyelvészetben jól használható modellnek (hasonlatnak) az esetjogban (precedensjogban) alkalmazott érvelési módszert, legalábbis úgy, ahogy az ún. esetalapú érvelésnek (CBR, Case-Based Reasoning) nevezett elméleti keretben azt elképzelik. Ez az elméleti keret nagyon tág, csak kevésben köti meg a kezünket, ami azt is jelenti, hogy a sokféle konkrét megvalósulása, ami a szakirodalomból ismert, egymástól sokban eltér, és az én javaslatom, amiről az itteni írásaimban beszélek, csak egy a sok lehetőség közül.

Az előző rész végén felsoroltam azokat a témaköröket, amik további részletezésre szorulnak. Ezek közül az első az ún. adatbázis, vagyis a korábbi esetek tára. Ez az esetjogban azokat a jogeseteket jelenti, amik precedensként felhasználhatók; a nyelvészetben a beszélők korábbi (nyelvi) tapasztalatainak felel meg.

Előrebocsátom, hogy amint adatbázist említünk, tisztában kell lennünk azzal, hogy az emberi viselkedés (ebben az esetben a nyelvi viselkedés) valóságos természetétől már nagyon távol vagyunk. Az emberi képességek nagy része mindenféle ún. procedurális tudás és ún. deklaratív, explicit tudás egyvelege. A procedurális tudásunkat nagyrészt öntudatlanul alkalmazzuk: tudjuk, hogyan kell valamit elvégezni (pl. kerékpározni, úszni stb.), míg a deklaratív tudás inkább úgy ragadható meg, hogy tudunk valamit (például hogy hogy hívják a pesti hidakat, hogy hol székel a miniszterelnök stb.), és ennek a tudásnak a tudatában is vagyunk. Adatbázisokkal és a rajtuk működő algoritmusokkal már ezt az alapvető különbséget sem tudjuk megragadni, nemhogy a még finomabb részleteket. Ezért az egész megközelítésünk – jobb híján – nyilván megengedhetetlenül leegyszerűsítő.

Az esetek felépítése

Az előző részben annyit mondtam el, hogy minden esetnek tartalmaznia kell egy esetleírást (problémát), egy döntést (megoldást) és a döntés indoklását. Az indoklásnak összefüggésbe kell hoznia a probléma jellegzetességeit a megoldás jellegzetességeivel, méghozzá úgy, hogy a megoldás minden jellegzetessége le legyen fedve. Vagyis a megoldásnak nem lehet olyan eleme, ami ne lenne megindokolva.

Azt is mondtam, hogy az indoklás a fentieken kívül csak korábbi esetekre hivatkozhat, azokon kell alapulnia. Azt viszont nem mondtam, hogy – és ez megint eltérés az esetjogtól – lehetnek olyan indoklások, amiket szaknyelven osztenzívnek neveznek. Hétköznapi nyelven úgy mondhatnánk, hogy ilyenkor az indoklás annyiból áll, hogy „csak”. Miért hívják a majom nevű állatot éppen majomnak? Csak. Létezik ennek történeti magyarázata (egy vándorszóról van szó, aminek talán az arab majmún a végső forrása, de lehet, hogy az is kölcsönzés valahonnan), de ennek a nyelvtudáshoz (amit végső soron modellálni próbálunk) semmi köze, a magyar beszélőknek erről fogalmuk sincs. A majom szó használatáról szóló tudásunknak sokféle forrása van (a gyerekkori plüssmajmunktól gyerekkönyvek illusztráción keresztül egészen a biológiakönyvekig és az állatkerti élményeinkig), ezek az élmények nagyrészt el is homályosultak (vagyis általánosítottunk is), de az nem számít indoklásnak. Indoklásként legfeljebb arra hivatkozhatunk, hogy megmutatták nevünk ezeket az állatokat, és közben a majom szót használták, többre nem. Ezt hívják osztenziónak.

A megoldás minden elemét indokolni kell, de a fordítottja nem igaz, nem kell a probléma minden aspektusának szerepet játszania a döntésünkben. Például vannak olyan esetek, amikor a szavak sorrendje szinte semmit sem számít (mondjuk hozd gyorsan és gyorsan hozd), legalábbis ha nem akarunk nagyon mélyre ásni a „megoldásban”, vagyis az értelmezésben. És ilyenkor a hangalaknak (vagy írásképnek) az ilyen jellegzetességei, amik nem játszanak szerepet a megoldásban, az indoklásban sem fognak szerepelni.

Ami viszont nagyon fontos, hogy a fent említett osztenzív esetek kivételével minden indoklásnak korábbi esetek indoklására kell hivatkoznia. Például olyan esetekben, amikor egy magyar szó -m-re végződik (ez az egyik aspektusa a problémának), és a megoldás egyik része az, hogy egyes szám első személyű birtokosra utal, akkor elvileg nem lesz nehéz korábbi indoklások tömegére hivatkozni, amik pont erre a megfelelésre hivatkoznak. Persze vannak ellenpéldák (mint a majom szó), amikre ilyenkor nem fogunk hivatkozni, más okok miatt (többek közt azért, mert nincs korábbi indoklás, ami a maj- szókezdetet névszói tőnek tekinti). Az is számíthat, hogy milyen mennyiségben találunk hivatkozási alapként számításba jövő korábbi indoklásokat (gyakoriság). Erre majd a precedensek keresésével kapcsolatban vissza kell térnem.

Szabály és szabályszerűség

Itt meg kell állnom egy pillanatra, mert az olvasónak nyilván eszébe jut a kézenfekvő kérdés: miért nem szabályokról beszélek? Hiszen évezredek óta minden nyelvtankönyvben szabályokkal találkozunk (néha nem szabály, hanem mondjuk táblázat formájában fogalmazzák meg, de akkor is). Az előző példára utalva: a birtokosra utaló magyar névszóalakok megalkotásának is szabályai vannak, például az egyes szám első személyű birtokosra utaló alakok szabálya azt írja elő, hogy biggyesszük a tő végére az -m toldalékot. Hát nem lenne ez sokkal egyszerűbb, mint mindenféle precedensekre hivatkozni, azok között keresgélni, aztán nagyjából ugyanazt csinálni, mint amit egy szabály előírna?

A válasz igen bonyolult és vitatott. Az elmúlt húsz év nyelvészeti szakirodalmának nem kis része éppen erről szól, érvek csapnak össze, és még nem hirdethetünk győztest. De ha megpróbálom nagyon leegyszerűsíteni, akkor talán úgy tudom elmagyarázni az eset-alapú (használat-alapú) felfogás mellett szóló érveket, ha arra hivatkozom, hogy a nyelvészek egyre több jelenséget egyre pontosabban szeretnének megmagyarázni. Például jó lenne megmagyarázni, hogy az emberek miért bizonytalankodnak egyes alakok megalkotásakor (gyümölcslém? gyümölcslevem?), miért használnak többféle alakot is (szám ~ szájam, fűm ~ füvem, olajom ~ olajam stb.), és miért, milyen irányban változnak az alakok (régen ajtaim, később ajtajim, ajtóim, illetve ajtajaim).

photo_camera Illusztráció: Toth Róbert Jónás / Qubit.hu

Sőt, még arra is kíváncsiak lennénk, hogy a többféle változat közül melyiket milyen arányban használják az emberek (akár ugyanaz a beszélő is használhat többféle változatot, eltérő gyakorisággal). Különösen pedig az adott lendületet az eset-alapú (és általában a használat-alapú) nyelvészetnek, hogy sokak szerint csak ennek a segítségével lehet magyarázni az anyanyelv elvelsajátításának folyamatát. (Közöttük talán a leghíresebb Michael Tomasello,, akinek két könyve magyarul is megjelent.) Eszerint ahogy szaporodik a nyelvi tapasztalatunk, úgy változik folyamatosan a fejünkben a nyelvi rendszer, éppen úgy, ahogy az esetjogban a jogrendszer az esetek szaporodásával folyamatosan változik.

Az 1980-as évek végétől sok nyelvész kezdte hangsúlyozni az ilyen jelenségek fontosságát, és arra lettek figyelmesek, hogy ezeknek a magyarázatához szükség van olyan információkra is, amiknek, ha szabályokban fogalmazunk, nincs szerepük. Például a gyümölcslém és a gyümölcslevem váltakozásában szerepe van annak, hogy összetett szóról van szó (aminek az utótagja a tő), hiszen a lém igen ritka, általában a levem alak győz. De még ennél bonyolultabb körülmények is szerepet játszhatnak abban, hogy van-e variáció, ha van, akkor milyen, és milyen arányban fordulnak elő az alakok. Például a legkülönbözőbb nyelvekben nagyon általános jelenség, hogy magának a tőnek a gyakoriságán múlik, hogy egy alakja létezik-e, vagy nem, márpedig a hagyományos nyelvtani szabályok nem hivatkozhatnak arra, hogy mennyire gyakori az, amire alkalmazzuk őket.

A szabályok segítségével való leírás olyan, mint a jogban a jogszabályokon alapuló, szabályozó jellegű tételes jog. Az utóbbi is a lehető legáltalánosabb megfogalmazásokra törekszik, és jellemzően nem hivatkozik korábbi jogesetekre, és különösen nem azoknak a tényálláshoz nem tartozó, járulékos körülményeire. Az esetjog egyik lényege éppen az, hogy nem tudhatjuk előre, hogy milyen járulékos körülmények lesznek később alkalmasak arra, hogy jogi érvelést alapozzanak rájuk, ezért a konkrét jogeseteket minden részletükkel együtt meg kell őrizni, és később bármelyik elemükre lehet hivatkozni. Ezért szabályok helyett az esetjogban (és az eset-alapú nyelvészetben is) inkább szabályszerűségekről kell beszélni. A szabályszerűségeket néha, szélsőséges esetekben (amik nagyon gyakoriak, banálisak) úgy is meg lehetne fogalmazni, mintha szabályba foglalnánk őket, de általában jobb felkészülni arra, hogy inkább az adatokban, korábbi precedensekben kell őket felfedeznünk. És ami a legfontosabb: szabályrendszerek használata esetén nagyon nehéz megragadni azt, hogy – ahogy feljebb mondtam – az esetek szaporodásával változik az egész jogrendszer vagy nyelvi rendszer. Ez az anyanyelvünk elsajátítása után is folytatódik: tulajdonképpen egész életünkben tanuljuk az anyanyelvünket, abban az értelemben, hogy egész életünkben változik az, ahogy az anyanyelvünket beszéljük.

Hozzáteszem: én nem úgy képzelem el az esetalapú nyelvészetet, hogy valóban minden egyes korábbi nyelvi tapasztalatunkra külön emlékszünk. Általánosításokra igenis szükség van, de csak bizonyos mértékben és bizonyos esetekben, nem pedig annyira, hogy a rendszert szabály-alapúnak lehessen tekinteni. Erre ennek a sorozatnak egy későbbi részében még visszatérek.

A szabályrendszerek tündöklése és bukása

A 20. század nagy része a szabályrendszerek bűvöletében telt. Nemcsak a nyelvészetben, hanem a mesterséges intelligenciában is. Ma már furcsának tűnik, hogy nemcsak az orvosi diagnózisok automatikus felállítását, és hasonló logikainak látszó problémákat, de még a betűk automatikus felismerését is szabályrendszerekkel próbálták megoldani. A 20. század végére ugyanis teljesen világossá vált, hogy a szabályrendszerek nem versenyképesek a példákból összefüggéseket automatikusan megtanuló rendszerekkel (például a neurális hálókkal).

Hogy miért sikeresebbek a nem szabályokon alapuló rendszerek, annak az az oka, hogy a nyelvek kifejezőerejének ára van (hiába, nincs ingyen ebéd). Minél több mindent tudunk kifejezni egy nyelven, annál bonyolultabb feladat az állítások érvényességének bizonyítása. Nagyon sokan hallhattak már Gödelnek arról a tételéről, ami szerint ha egy nyelv legalább egy bizonyos kifejezőerővel rendelkezik (ilyen például a matematika nyelve is), akkor meg lehet benne fogalmazni olyan igazságokat, amiket sohasem fogunk tudni bizonyítani, vagyis az axiómáiból levezetni. De már kicsit kevésbé kifejező nyelveknél is előfordulhat, hogy egyes bizonyítások az általános esetben végtelen hosszúak, vagyis végrehajthatatlanok lehetnek. Márpedig a matematikai bonyolultságot nem lehet megkerülni, ha bizonyításokat automatizálni akarunk (hiába, nincs királyi út).

Lehetetlen persze pontos becslést adni, de valószínű, hogy egy természetes nyelv leírásához tízezresével, esetleg százezresével kellene szabályokat felállítanunk. És nemcsak ezeknek a szabályoknak a kiderítése ütközik óriási nehézségekbe. Még nagyobb baj az, hogy ha véletlenül sikerül őket kinyernünk valahogy, akkor a szövegalkotás és a megértés automatizálásához alkalmaznunk is kellene őket, ami a gyakorlatban bizonyításokat jelent. És úgy tűnik, hogy egy nyelv szabályszerűségeinek leírásához elég bonyolult, nagy kifejező erejű szabály-nyelvre lenne szükség, annyira, hogy a bizonyítások reménytelenül bonyolultak – és ugyanez áll például az orvosi vagy a jogi tudásbázisokhoz szükséges logikai nyelvekre is.

Ezért aztán a szabályrendszerek nagy divatja már a múlt század végére hanyatlóban volt, ami azt jelenti, hogy a céljaikat kellett erőteljesen korlátozni ahhoz, hogy egyáltalán alkalmazhatóak legyenek. Márpedig a nyelvészetben a 20. század végére éppen ezzel ellenkező igények jöttek létre. Nem korlátozni, hanem bővíteni szerettük volna a leírható jelenségek körét. Ezért a szabályrendszerek használata a számítógépes nyelvészetből is nagy mértékben kiszorult.

A nyelvi szabályszerűségek természete

A nyelvi szabályrendszerek használatát nemcsak a szabályok óriási száma és a kifejezésükhöz szükséges nagy kifejező erejű logikai nyelv nehezíti, hanem az is, hogy a szabályok ráadásul bonyolult összefüggésekben állnak egymással. A nyelvi szabályszerűségek egy fajtája a jelenségeknek (kifejezéseknek, kifejezéstípusoknak) egy nagyon nagy körében érvényesül, általános jellegű. De ezek alól gyakran vannak kivételek. Egy-egy kivételes alosztályba a nagy körbe tartozó kifejezéseknek csak egy kis része tartozhat (Charles Yang szerint maximum x/ln(x) kifejezésfajta tartozhat egy-egy kivételes alosztályba, ahol x a nagy kör létszáma. Érdekes módon ennek a számnak a határértéke a prímszámtétel szerint az x-nél kisebb prímszámok száma).

A szabályszerűség szempontjából kivételes jelenségek viszont mindig sokkal gyakrabban fordulnak elő, mint a sokkal több „szabályos(abb)” jelenség. És a „kivételes” kisebb jelenségkörök hasonlóan épülnek fel: ezeknek a kivételes viselkedése is csak annyira egységes, hogy lehetnek kicsi alcsoportjaik, amik a kivételes viselkedésűektől is eltérnek, azokon belül is „kivételt” képeznek, és ezek még gyakrabban fordulnak elő a nyelvhasználatban. A szabályszerűségeknek ez a „fraktális” szerkezete furcsa, nehezen kezelhető struktúrákba rendezi őket, amit szabályrendszerekkel nagyon nehéz megragadni. (Külön probléma, hogy – mivel a jelenségek fajtáinak száma és a gyakoriságuk is szerepet játszik – csak olyan szabályrendszerek jöhetnek számításba, amik számításba veszik a szabályok alkalmazhatóságának számszerű jellemzőit. Erre egy későbbi részben még visszatérek.)

Mondok egy példát, hogy ezt érthetőbbé tegyem. A magyar igék között vannak egy kis rendhagyó csoport, amiknél a tő végén hol d, hol sz, hol v mássalhangzó van (pl. törekedni, törekszik, törekvő), és ezek az összes igén belül a leggyakoribbak között vannak. Ez tehát legalább egy kivételes alosztály, bizonyos különleges sajátosságokkal. Lehet, hogy érdemes eleve több kivételes alosztályba sorolni őket, mert nem teljesen egyformán viselkednek, például van olyan is, hogy igyekezni, (nem pedig igyekedni), igyekszik, igyekvő, de ez most nem lényeges. Ennek az alosztálynak van néhány különleges sajátossága, ami a benne levő összes igét jellemzi, például az, hogy -szik-re végződik a jelen idejű, egyes szám harmadik személyű alakjuk. De ezeken az igéken belül további kivételes alosztályok vannak, például olyanok, mint a fekszik, feküdni, fekvő, ezekből még sokkal kevesebb van, és egyenként még gyakoribb az előfordulásuk, és különleges sajátosságuk például a puszta tőhöz járuló -hat/-het (pl. fekhet). És vannak még ezen az osztályon belül is különlegesek, például az eszik, enni, evő és pár társa, nagyon kevesen vannak, és még sokkal gyakoribbak.

Az egyik legnépszerűbb, de sokat vitatott elképzelés szerint (az ún. „kettős elérési út”-, angolul dual route-modell szerint, ami Steven Pinker nevéhez fűződik) a nyelvtudásunk olyan természetű, hogy a kivételes alakokat egyszerűen megjegyezzük, memorizáljuk, és úgy ismerjük fel őket, illetve úgy ejtjük ki őket, hogy az emlékezetünkből felidézzük őket. A szabályos alakokat viszont a szabályok segítségével „kiszámoljuk”. De egy ilyen kettősség feltételezése nem nagyon fér össze azzal a „fraktális” felépítéssel, amiről beszéltem. Ezzel együtt a nyelvi kifejezések két nagy osztályra, „szabályosakra” és „kivételesekre” osztása is kétségessé válik, ezen keresztül viszont maguknak a szabályoknak a létjogosultsága is. Az esetalapú okoskodásnak egyik nagy vonzereje, hogy nem kényszeríti ránk ezt a kettéválasztást, miközben persze szabályszerűségek ebben is vannak, az adatbázisban, az esetek, a döntések és az indoklások összefüggéseiben.

Kapcsolódó cikk a Qubiten:

link Forrás