Pistát durván leugattam, erre ő besértődött és elküldött
Elsőre azt hihetnénk, nincs is egyszerűbb kérdés annál, mint hogy mi a mondattan (közkeletű idegen szóval: szintaxis). Mi lenne, természetesen az a szabály- vagy szokásrendszer, ami meghatározza, hogy hogyan építjük fel, szerkesztjük meg a mondatainkat. A magyar mondattan a magyar mondatalkotási szokásokat írja le, úgy általában a mondattan pedig arról szól, hogy milyen fogalmak, viszonyok játszanak szerepet az emberi nyelvek mondattanaiban.
Csakhogy amint ennek a részletein elgondolkodunk, rengeteg kérdésbe, sőt nehézségbe ütközünk. Például amikor a múltkor a magyar mondat néhány alapvető vonásáról írtam, kiderült, hogy az „állítmány” mibenléte nem is olyan egyszerű kérdés, hogy lehetnek a mondat ragozott főigéjének a környékén olyan más szavak, amik többé-kevésbé szorosan hozzá tartoznak, de hogy ezek közül pontosan mivel alkot szerkezetet, mikor mondhatjuk, hogy „összetett állítmány” van a mondatban, arra semmi támpontunk, objektív kritériumunk nincs.
Nem különleges esetről van szó. Nem az a helyzet, hogy a magyarban, ebben az egzotikus nyelvben van néhány furcsa szerkezet, aminek a megítélése nem könnyű. Nekem inkább az a benyomásom, hogy a legtöbb nyelvben a legtöbb szerkezet ilyen „furcsa”, ha pedig így áll a dolog, akkor talán inkább ezt kéne normálisnak, alapesetnek tekinteni.
A mondatoknak van szerkezetük
Nem nehéz belátni, hogy a mondatok rendelkeznek bizonyos szerkezeti tulajdonságokkal. A legegyszerűbb bizonyítéka ennek az, hogy léteznek olyan többértelmű mondatok, amikben nincsenek többértelmű elemek. Ilyenkor ugyanis a többértelműséget nem tulajdoníthatjuk másnak, mint az amúgy láthatatlan és hallhatatlan szerkezetnek. Például: A laborban sivító majmok és nyulak voltak. Aki ezt mondta, az vajon azt akarta-e mondani, hogy a nyulak is sivítottak? (Most hagyjuk azt, hogy nyulak nem szoktak sivítani, attól még mondhatja valaki ezt.) Nyilván így is érthette a mondatot, meg úgy is, hogy csak a majmok sivítottak. Mindenesetre tény, hogy kétféleképpen értelmezhető ez a mondat, attól függetlenül, hogy az ember kerülni szokta az ilyen félreérthető megfogalmazást (és jól teszi). És a kétértelműséget csak azzal magyarázhatjuk, hogy kétféle szerkezetet tudunk tulajdonítani a mondatnak.
És akkor mindjárt egy nehézséghez érkeztünk. Vajon miféle két szerkezet az, ami a kétféle értelmezést lehetővé teszi? Hogyan írjuk le, hogyan ábrázoljuk őket? Itt van például mindjárt két lehetőség:
- „Zárójelezés”. Az egyik értelmezés szerint, amikor csak a majmok sivítottak, így elemezhetjük a mondatot: A laborban [[sivító majmok] és nyulak] voltak.A másik értelmezésben viszont, amikor mindenki sivított, így:A laborban [sivító [majmok és nyulak]] voltak.
- „Láthatatlan kapcsok”. Az első értelmezés annak felel meg, hogy a sivító melléknév csak a majmok főnévhez kapcsolódik.
A második viszont olyan szerkezetnek felel meg, amikor a jelző a majmok és a nyulak főnévhez is kapcsolódik:
Mindkét fajta ábrázolás mellett mindenféle érveket fel lehetne hozni, és persze ellenük is lehet érvelni. A zárójelezős ábrázolás például túl szigorúnak tűnik, mert csak egymás mellett álló szavakat lehet „összezárójelezni”, márpedig sokszor van olyan, hogy összetartozó szavak nem közvetlenül egymás mellett foglalnak helyet. Ezzel szemben a láthatatlan kapcsokat használó ábrázolás meg önmagában túl engedékenynek tűnik, hiszen nem mond semmit sem arról, hogy milyen szavak között lehetnek kapcsolatok. Ráadásul bizonyos esetekben a zárójelezésnek mindenképpen van létjogosultsága, hiszen léteznek a mondatokban tartományok, olyan részek, amik világos módon egységet alkotnak. Például maguk a teljes mondatok bizonyos értelemben ilyen tartományok annyiban, hogy a bennük levő elemek nemigen kapcsolódhatnak mondattanilag mondjuk a velük szomszédos mondat elemeivel.
Vegyük ezt a mondatot: Pistát durván leugattam, erre ő besértődött és elküldött. Nem lehetséges ezt a mondatot úgy értelmezni, hogy az első tagmondatbeli durván határozó a második tagmondat elküldött igéjére is vonatkozzon. Lehet persze, hogy Pista durván küldte el a beszélőt, de ezt a beszélő ezzel a mondattal biztosan nem állította, és arra sincs semmi alapunk, hogy „kétértelműnek” tekintsük a megnyilatkozását (úgy, hogy az egyik értelemben az elküldés is durva volt, a másikban meg nem).
Mindenesetre úgy látszik, hogy a szerkezetek létezésének tényét nem nagyon lehet tagadni, és más kérdés, hogy milyen természetűek ezek a szerkezetek. Még magánál az alapkérdésnél maradva: Nem véletlen, hogy a szerkezetek létezését jelentéstani alapon tudtuk belátni. A különböző elemek összetartozása (akár zárójelezéssel, akár máshogy képzeljük el és ábrázoljuk) alapvetően jelentéstani kapcsolatokat tükröz, ilyeneknek felel meg. A nyelvészet egyetlen nyelvben sem ismer olyan jelenséget, ami arra utalna, hogy egymáshoz jelentésüket tekintve nem kapcsolódó elemek mondattanilag szoros kapcsolatban lennének egymással. De éppen ezért elég nagy eltérések is vannak abban, hogy ki mit érez a mondattanhoz tartozónak. A legszűkebb értelmezés szerint csak azok az eszközök tartoznak ide, mint például a szórend vagy az egyeztetés, amik kifejezetten az elemek összetartozásának jelölésére szolgálnak. Mások viszont a legkülönbözőbb jelentéstani viszonyokat is a mondattanhoz sorolják, ha mondatokban különböző elemek egymáshoz kapcsolódásához van közük. Például állíthatja valaki azt, hogy a Jóska zöldre festette a kerítést mondatban a zöldre és a kerítést között van valamilyen mondattani viszony, hiszen tartalmilag ebben a `zöld' ugyanúgy a kerítésre vonatkozik, mint mondjuk a zöld kerítés jelzős szerkezetben. Szóval végülis egyáltalán nem egyszerű a válasz a kiinduló kérdésre, hogy mi is az a mondattan.
Szavak és szóelemek
Az ókorban úgy gondolták, hogy a mondatok alkotóelemei a szavak, és ez a felfogás máig öröklődik az iskolai nyelvtanban és egyes tudományos iskolákban is. Ezzel több probléma is van, az egyik mindjárt az, hogy nincs általánosan elfogadott meghatározása annak, hogy mit is kellene pontosan szónak nevezni. De van más probléma is, ha úgy döntünk, hogy nem kukacoskodunk, és nem foglalkozunk a kínos esetekkel, amikor nem lehet megmondani, hogy valami önálló szó-e. (Például a franciában azok a hangsúlytalan személyes névmásokat, amiknek közvetlenül egy ige előtt, néha közvetlenül utána kell állniuk, simán tekinthetnénk az igealak részének.) Ez a másik probléma az, hogy nagyon sok nyelvben van olyan elem, amit nem szeretnénk önálló szónak tekinteni, mégis úgy látszik, hogy mondattani jelentősége, önálló mondattani szerepe van.
Vegyük például azt a szóelemet, ami a magyarban a szerencsétlen módon középfoknak nevezett funkciót fejezi ki. (Azért szerencsétlen az elnevezés, mert a „középhez” ennek a funkciónak nem sok köze van, a magasabb szó semmilyen értelemben nem utal valaminek a közepére, csak annyit fejez ki, hogy egy magassági skálán valami feljebb van, mint valami más.) Nem véletlen, hogy számos nyelvben önálló szó tölti be ezt a funkciót (például a franciában a plus szó), vagy hol önálló szó, hol pedig szóelem (például az angolban hol a more szó, hol az -er toldalék). A középfok használatának az egész mondatszerkezetre hatása lehet, hiszen legtöbbször összehasonlító szerkezetben használjuk. Így aztán támadható, mert „trükközésnek” minősíthető az olyan elemzés, ami a Mari magasabb, mint Jóska típusú mondatokban a mint szót az összehasonlító szerkezet jelölésére szolgáló mondattani eszköznek tekinti, míg a magasabb szó végén levő toldalékot, ami ugyanebben a jelölésben vesz részt, nem tekinti mondattani eszköznek. (Eszerint az elemzés szerint a középfok toldaléka csak alaktani eszköz, a középfokú melléknév képzésének eszköze, közvetlenül mondattani szerepe pedig csak az egész középfokú melléknévnek, a magasabb-nak van.)
Van a mondattannak olyan megközelítése is, ami ilyen meggondolások miatt nem a szavakat, hanem a legkisebb szóelemeket (az ún. morfémákat) tekinti a mondat építőköveinek. Ilyen például az amerikai strukturalista nyelvészet mondattani elképzelése. Ez az iskola elsősorban a nyelvi leírás módszertanának kutatásával foglalkozott, és leginkább arról volt nevezetes, hogy rengeteg nyelv (főleg észak-amerikai indián nyelvek) leírását készítette el sikeresen.
Nemcsak az kérdéses a mondattanban, hogy mennyire kicsik legyenek az alapelemek (szavak vagy szóelemek), hanem az is, hogy mennyire nagyok lehetnek. Például azok az idiómák, kollokációk szerkezeti minták, amikről egy korábbi írásban már szóltam, sokszor egyetlen egységként viselkednek, és bár több szóból állhatnak, a belső szerkezetük sokszor érdektelen (és a jelentés kibogozásában sem megyünk velük sokra, ha nem ismerjük őket, nem tudjuk megfejteni őket, vagy legalábbis nem jutna eszünkbe pont velük kifejezni a gondolatunkat). Más esetekben meg fontos ugyan a belső szerkezet, de mégsem célszerű (mert semmire sem jó) a legkisebb alapelemekre „szételemezni” őket. Például ha azt mondom, Tüntetések ide, tüntetések oda, ..., egy olyan szerkezetet használok, aminek az alakja „X ide, X oda”, de az ide vagy az oda funkciójáról (pl. „mondatrészi szerepéről”) nem túl értelmes beszélni ebben az esetben. Ez a szerkezet tehát szinte minden értelemben alapelemnek tekinthető.
Ne gondoljuk, hogy az ilyen panelek olyan ritka kivételek lennének, amik csak speciális mondatokban fordulnak elő. Elég például csak az ebben az írásban feltett kiinduló kérdést megnézni, abban is találunk például furcsaságot (amiről kicsit részletesebben egy másik portálon már írtam). Mi az a mondattan? Mit keres ebben a mondatban az ún. mutató névmás? Jó, kérdezhettem volna úgy is, hogy Mi a mondattan?, de az-zal együtt nekem természetesebben hat. És ez a „Mi az a ...” ugyanolyan előregyártott panelnek tűnik, mint az előző példában az „X ide, X oda”. Például abból látszik ez, hogy az egész mondat csak ebben a szórendben képes kifejezni a szándékolt jelentését, mert egész mást jelentene az (ha egyáltalán valaki mondana ilyet), hogy Az a mondattan mi?
Egy kísérlet
Azt hiszem, kellőképpen szkeptikusan érzékeltettem, hogy mennyire nem világos, mi az a mondattan, illetve hogy milyen sok elágazási lehetőség van, mennyi eltérő megközelítése lehetséges. Legyen ez intő jel azoknak, akik egy-egy tankönyvbe belenézve valamelyik felfogásról azt találják, hogy az a mondattan.
Én mindenesetre megpróbálkoztam egy kísérlettel, amiben a lehető legkevesebbet próbáltam feltételezni a mondattanról, és arra voltam kiváncsi, hogy mit tudunk hatalmas korpuszból (szövegekből) automatikusan kinyerni magyar mondatok szerkezetéről. Ezért a „láthatatlan kapcsok” elképzelésből indultam ki, és a mondatokat a lehető legkisebb elemekre bontottam fel (ebben az MTA Nyelvtudományi Intézetében és az MTA Számítástechnikai és Automatizálási Kutatóintézetében dolgozó kollégáim, különösen Makrai Márton volt a segítségemre). Egyetlen plusz feltételezést még tettem, méghozzá azt, hogy az elemek egymáshoz való közelségének nagy jelentősége van, mert ez valamennyire minden általam ismert nyelvben érvényesül.
Semmi mást nem tettem, mint vettem a már sokat emlegetett magyar webkorpuszból kiválasztottam a maximum 20 szóból álló tagmondatokat (ez több mint 100 millió tagmondatot jelentett), és végeztem rajta egy ahhoz hasonló statisztikát, amilyenről egy korábbi írásban már beszéltem: szóelemek ún. kölcsönös információját számoltam ki, ami azt fejezi ki, hogy mennyire gyakran fordulnak elő együtt az illető szóelemek. A közelség hatását úgy építettem bele ebbe, hogy a kiszámolt kölcsönös információ számolásában változó súlyt adtam az együttes előfordulásoknak (egy szorzótényező segítségével), méghozzá úgy, hogy a távolsággal a súly exponenciálisan csökkenjen.
Ezek után úgy „elemeztem” magyar mondatokat, hogy a bennük szereplő szóelemeket aszerint kötöttem össze „láthatatlan kapcsokkal”, hogy a statisztika szerint mennyire szoktak összetartozni (és ugyanúgy súlyoztam az összetartozásukat, a távolságukkal fordított exponenciális arányban). Így nemcsk kapcsokat kaptam, hanem a kapcsoknak különböző erősségük is lett. Persze az általános statisztikát egyes adott, véletlenszerűen kiválasztott mondatokra ilyen módon visszaalkalmazva tévedhetünk is, hiszen attól, hogy két elem között összetartozás figyelhető meg, még nem biztos, hogy az adott mondatban is összetartoznak. De ezt a hibalehetőséget csak nagyon bonyolultan lehetne kiküszöbölni, úgy, hogy nem mindig csak két-két szóelem együttes előfordulását nézzük, hanem valahogy a tágabb környezetüket is bekalkuláljuk, ami nagyon elbonyolítaná a dolgot. Mindenesetre abban a néhány mondatban, aminek az „elemzését” így megvizsgáltam, nem találtam nagy, nyilvánvaló félreértéseket.
Itt van például egy tagmondat: megerőltetés nélkül szeretné leadni kilóit, rugalmasabbá tenni bőrét. Nem túl váratlan, hogy a legerősebb kapcsokat az egyes szavakon belüli szóelemek között találtam, például a szeret- és a -né között. Aztán nagyon erős kapocs van például a tesz- és a -vá/-vé között (azon belül, hogy rugalmasabbá tenni), vagy például a szeret- és a -ni között (azon belül, hogy szeretné leadni). Ezek a hagyományos szóhasználatban ún. vonzat-viszonyok, a tesz igének lehet -vá/-vé toldalékos, a szeret igének meg főnévi igeneves vonzata. Aztán erős a kapocs a rugalmas és a bőr között (azon belül, hogy rugalmasabbá tenni bőrét), holott a hagyományos mondattani elemzés szerint a rugalmasabbá és a bőrét nem tartoznak szorosan össze (hanem mindkettő a tenni bővítménye). Jelentéstanilag viszont pont olyanok, mint amit fent a zöldre festett kerítéssel kapcsolat példájával illusztráltam.
Aztán van még néhány váratlan érdekesség az „elemzésben”, például a le- és a kiló között igen erős a kapocs (azon belül, hogy leadni kilóit). Ez annak tulajdonítható, hogy sokféle ige állhat le- igekötővel és olyan bővítménnyel, amiben a kiló az alaptag: lead, ledob, ledolgoz, lemegy stb. Ezért, bár a fenti kapcsolatokhoz nem hasonlít, egyáltalán nem indokolatlan feltételezni, hogy bensőséges kapcsolat van a kilóknak a „le” (vagy a „föl”) iránnyal. Végül az is érdekes, hogy a tesz igetőnek nemcsak a -vá/-vé toldalékkal, hanem a középfokkal is elég erős a kapcsolata (azon belül, hogy rugalmasabbá tenni). Hiszen igen gyakran nem egyszerűen „valamivé” vagy „valamilyenné” tételről beszélünk, hanem „valamilyenebbé”, és ez majdnem olyan, mintha egyfajta vonzata lenne a középfok a tesz igének (legalábbis a -vá/-vé jelenlétében).
Nem állítom, hogy a kísérletemben használt módszerrel mondattani elemzést végeztem, hiszen az írásomban végig azt hangsúlyoztam, hogy nem tudok választ adni arra, hogy mi pontosan a mondattan. Ráadásul a módszerem a szórendet semmilyen formában nem vette számításba (csak a mondatbeli távolságokat), pedig jól tudjuk, hogy az fontos része a mondattani szerkezetek, a viszonyok kifejezésének. De mivel a jelentéstani összetartozás igen erősen összefügg a mondattani szerkezettel, és a kölcsönös információ elég jól ki tudja mutatni az ilyen összetartozást, a kísérletemben használt technika jól használható a mondattani szerkezetek felderítésében (használják is), akármit jelentsen is az.
A szerző nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa. A Qubit.hu-n megjelent írásai itt olvashatók.