Hogyan derül ki a szókincsből, hogy uráli nyelv a magyar?

A szókincsről általában

A szókincs a legfeltűnőbb és a legbecsapósabb. 

A naiv beszélők gyakran a szókincsükkel (a tartalmasabb szótövek összességével) azonosítják magukat a nyelveket. Hosszabb magyarázat után ismerik csak fel, hogy például a magyar nyelv sokkal több, mint a magyar szavak gyűjteménye. Ezért a naiv nyelvrokonítóknak is a szókincs a kedvenc vesszőparipájuk, pedig valójában a szótövek állománya nagyon félrevezető. Például az angol szókincs nagyobb része francia (normann) eredetű (bár ha a gyakoriságot nézzük, a germán eredetű szavakat többet használják). Az angol mégis egyértelműen a germán nyelvek csoportjába tartozik. 

Miért ilyen becsapós a szókincs? Azért, mert ez a nyelvek legváltozékonyabb, „legsérülékenyebb” része. Gondoljunk csak bele: ha egy régi magyar filmet nézünk (mondjuk a világháború előttit vagy röviddel utána készültet), különösebb hangváltozásokat nem fogunk tapasztalni, a mondattani szerkezetben (szórend stb.) alig ér minket meglepetés. Viszont számtalan olyan szót fogunk hallani, amit ma már nem nagyon használnánk, és megfordítva, nagyon könnyen tudunk vég nélkül sorolni olyan szavakat, amiket akkor még nem értettek volna. A szótövek kölcsönzése (és a nyelv saját eszközeivel új szavak megalkotása) a nyelvi változás leggyakoribb és legfeltűnőbb formája, ezért a nyelvrokonság megállapításánál nagyon elővigyázatosan kell bánnunk a szótövekkel. Az előző részben is figyelmeztettem arra, hogy több nyelv szavai között rendszeres eltérésekről, hangmegfelelésekről csak azoknak a szótöveknek az esetében van értelme beszélni, amikről tudjuk (vagy sejtjük), hogy azonos eredetűek – és megfordítva, a rendszeres megfelelésekhez való illeszkedés jó érv lehet az azonos eredet mellett. Ugyanakkor a hangtani és jelentéstani megfeleléstől független, külön bizonyítékaink nemigen lehetnek a szótövek rokonsága mellett. 

A jelentésváltozás sajnos nem rendszeres.

Különös probléma a szótövek rokonításánál, hogy az eltérő nyelvekben az azonos (vagy közel azonos) eredetű szótövek jelentése nem szokott teljesen egybeesni. Ez természetesen attól van, hogy a szavak használata, jelentése is folyamatos változásban van. A jelentésváltozás kicsit lassabb, a szókincsnek kisebb körét érinti, mint a hangváltozás, de azokban az esetekben gyorsabb és feltűnőbb. Hát persze hogy az albérlet ma egy kicsit mást jelent, mint a rendszerváltás előtt (és talán még utána is egy ideig), amikor csak arra utalhatott, hogy egy valaki által – általában az államtól – bérelt lakás egy részét adják ki bérbe, ma viszont bármilyen bérlakásra mondják. 

A szókincs változásáról ugyanazt mondhatjuk, amit a hangváltozásokról is mondtunk. Univerzális, a világ nyelveire általában jellemző tendenciák érvényesülnek benne, és ezeket az általános nyelvészeti tendenciákat figyelembe kell venni, amikor a rokonsági viszonyokat a szókincs alapján vizsgáljuk. (A „műkedvelő”, dilettáns nyelvészkedőket, akik mindenféle délibábos elképzeléseket alkotnak a nyelvrokonságról, éppen az jellemzi, hogy nem veszik figyelembe ezeket az univerzális törvényszerűségeket.) Ugyanakkor viszont az általános (és kicsit képlékeny) tendenciáknál szigorúbb ismérveket nem nagyon mondhatunk a jelentésváltozásról: az nem olyan rendszeres, mint a hangtani. 

Például hiába gondoljuk – egyébként jogosan –, hogy az emberi élet legfontosabb, legalapvetőbb jelenségeire utaló szavak egy nyelv életében mindig is léteztek, ezért semmi okuk nem volt rá, hogy kölcsönzés útján vagy másképpen lecserélődjenek, ezt csak irányadó alapelvnek tekinthetjük. Például mindig minden emberi közösségben éltek anyák, apák és gyerekek, de az ezekre a szerepekre utaló szavak mégis elég gyakran változhatnak a nyelvekben. Éppen a hozzájuk való erős érzelmi viszonyuk miatt mindenféle beceneveket, kedveskedő kifejezéseket kezdünk használni a megjelölésükre (magyarul is: anyu, mami, mama stb.), és így, akármilyen alapvető dolgokat jelölnek, a formájuk lehet változékony. De persze csak lehet: nem lehet általánosan kimondani, hogy az ilyen szótövek sosem maradandóak. A magyarban például az anya és apa szavak eredetét feltehetően legalább a finnugor korig visszavezethetjük, de már a gyermek szó eredete ismeretlen. 

A szókincs különböző rétegei eltérő módokon változnak. 

A szókincs arról is nevezetes, hogy különböző részeit eltérően érintik a változások. A kulturális újításokhoz kapcsolódó szókincs (a legszélesebb értelemben véve, az ételek nevétől a szakmák, szokások stb. szókincsén át egészen a tárgyak nevéig) általában követi magukat a kulturális hatásokat. Ezzel szemben azok a szavak, amik kulturális hatásoktól viszonylag független dolgokat jelölnek, nincsenek ennek kitéve. Ki lehetnek téve ugyanakkor másmilyen tényezőknek. Például ilyen az erős érzelmi töltés, amit az anya, apa és gyerek esetében említettem: a legközönségesebb, leggyakrabban használt szavaknak szokott a legtöbb rokonértelmű szavuk (szinonimájuk) lenni, és ezeknél nagyon gyakran előfordul, hogy valamelyik szinonima szerepe megváltozik, például megnő, a többi rovására. Így például a 'fej' jelentésű francia szó, a tête (ejtsd: tet) a latin testa 'csupor, kancsó' szóból származik. Vagyis a legsemlegesebb szó egy valamikori szleng, majd beszélt nyelvi (kollokviális) szótőből ered. (Olyan, mintha ma a magyarban az eredetileg 'tök' jelentésű kobak lenne a 'fej' jelentésű legsemlegesebb szó.) Ugyanakkor a 'fej' jelentésű latin caput szóból származó chef azt jelenti, hogy 'főnök', mert ez volt az egyik szinonima, ami 'vezetőt, főnököt' jelentett. Vannak szócsoportok, amik kevésbé érthető módon viselkednek, például a színnevek. Az újlatin nyelvekben szinte kivételes az olyan színnév, ami az öröklött latin szókincsből származna (ilyen kivétel például a román alb 'fehér': az albus leszármazottai a többi újlatin nyelvben kihaltak vagy csak nagyon speciális, pl. költői környezetben használatosak). Őszintén szólva nem tudom, mi az oka annak, hogy a legtöbb színnév esetében valamilyen kölcsönszó vagy belső képzésű tő kiszorította a latinból öröklötteket, és úgy tudom, a magyar nyelvre is igaz, hogy a színnevek általában nem az ősi uráli örökséghez tartoznak. 

Viszont a francia tête 'fej' példája, amit említettem, inkább a kivétel, mint a gyakori eset. A magyarban a kobak (vagy más) nem szorította ki a fej szótövet, és ez általában is igaz, a legfontosabb testrészek neve más nyelvekben is általában az öröklött szókincshez tartozik. Hasonlóan kivételes, amikor a számnevek nem hagyományozódnak át. Előfordul, de nagyon ritka. Például japánul leggyakrabban (és főleg hivatalos szövegben) úgy számolnak, hogy kínai eredetű szavakat használnak (miközben más célokra használják az öröklött japán számokat is), mintha mi a latin számneveket használnánk számolásra: únusz, duó, trész stb. De, mondom, az ilyesmi teljesen kivételes. 

Van néhány szócsoport (testrészek, számok, toldalékok), amiben nagyobb az esély az öröklött szókészlet megőrzésére. 

A fentiek miatt vannak a szótöveknek olyan csoportjai, amik sokkal nagyobb eséllyel maradnak fenn több rokon nyelvben is. Így a különböző rokon nyelvekben az alakjukban sokkal nagyobb eséllyel találhatunk rendszeres megfeleléseket, eltéréseket (mint az előző részben láttuk, ezek a rokonság fő bizonyítékai). Ugyanakkor a szótövek jelentése csoportonként eltérően változékony. Például a fő testrészek neveinek jelentése kevésbé szokott változni, mint például azok, amik valamilyen értelemben a „szakszókincshez” tartoznak: konkrét növény- és állatfajták, földrajzi formák, népek stb. neveinek gyakran változik a jelentése. Ez azért van, mert az emberek (a nyelv változásától függetlenül is) könnyen összekeverik őket. Ráadásul a vándorlásokkal együtt jár, hogy a beszélők környezete megváltozik, és ilyenkor gyakran egy korábbról ismert, de a környezetükben már nem megtalálható jelenség nevét olyanra viszik át, ami az új környezetben gyakori. Így nem csodálkozhatunk, ha mondjuk a magyar bogyó szónak megfelelő rokon nyelvi szavak mindenféle konkrét bogyóra (pl. vörös áfonyára) utalnak, vagy hogy a kígyó szó egy-egy rokona nem feltétlenül általában 'kígyót', hanem mondjuk 'viperát' jelent. A vaj szó uráli rokonai nem mind jelölnek tejterméket, például a hanti voj szó 'zsírt' jelent (például összetételben a halzsírra is ezt használják). 

Illusztráció: Tóth Róbert Jónás

Ahogy feljebb írtam, ide tartoznak a fő testrészek, szervek nevei és a tőszámnevek. De ide sorolhatjuk a toldalékokat is, bár ezeknek az összehasonlításánál vannak sajátos nehézségek. Egyrészt gyakori, hogy ami az egyik rokon nyelvben toldalék, az egy másikban önálló szó (ilyenkor az utóbbi a konzervatívabb, mert a toldalékok önálló szavakból keletkeznek). Másrészt a toldalékok, mivel a szóalakoknak nem ők a legtartalmasabb részei, „gyenge helyzetben” vannak (például hangsúlytalanok), ezért hajlamosak redukálódni (pl. rövidülni). Viszont a nyelvekben a toldalékok kölcsönzése a legritkább, ezért a toldalékok közötti valószínűsíthető megfelelések a legékesebb bizonyítékai a nyelvrokonságnak. (Gondoljunk csak az előző részben említett példára, a „középfok” -b(b) toldalékára a magyarban.) 

Kölcsönzött toldalékok szinte csak akkor szoktak felbukkanni egy nyelvben, ha egész toldalékolt szavak nagyobb csoportjait veszik át, és az ezekben felismerhető toldalék valamennyire önállósul. Ilyen például a magyarban az -ista (eredetileg csak görög-latin eredetű szavakban fordult elő, de később sok magyar szótőre is rákerült, például egyetemista, zongorista) vagy sok becéző képző, ami becézett idegen nevek átvételével került a magyarba (például a -kó a Jankó-félékből). 

A közös uráli szókincsről

Tekintélyes számú uráli eredetű szótő van még a mai magyar nyelvben is. 

Sokan keveslik azokat a magyar szótöveket, amelyek az uráli örökséghez tartoznak, mondván hogy például az angolban sokkal nagyobb a germán eredetű szavak aránya. Tény, hogy az alig kétszáz (Honti László szerint 181) uráli eredetű magyar szótőnek körülbelül két-háromszorosa az angol nyelv germán eredetű szótöveinek száma. Csakhogy figyelembe kell venni, hogy a germán nyelvek igen későn, az első évezred közepe felé kezdtek egymástól elkülönülni, addig nagyjából egységes tömböt alkottak, míg az uráli nyelvek közös ősének életének végét, bár nagyon keveset tudunk róla, legalább kétezer évvel korábbra teszik. Valamivel jobb az eredmény, ha a közelebbi rokon obi-ugor nyelvek (a korábban osztyáknak nevezett hanti és a korábban vogulnak nevezett manysi) szókincsét hasonlítjuk a magyaréhoz. (Honti László szerint a nem uráli, csak finnugor eredetű magyar szótövek száma 357, a csak ugor eredetűek száma pedig 162. Az uráli, a csak finnugor és a csak ugor eredetű tövek száma tehát összesen 700, ez már elég jelentős.) 

Tegyük hozzá, hogy ugyanúgy, ahogy az angolban a germán eredetű tövek a leggyakoribbak (még ha kevesebben vannak is, mint a francia eredetű tövek), a magyarban is az ugor, a finnugor és az uráli korból öröklött tövek a leggyakoribbak: kb. 80 százalékát teszik ki az előforduló töveknek. 

A szókincs különböző rétegeinek eredete egybevág a magyar nyelv történetének szokásos felfogásával. 

Természetesen még a visszakövetkeztethető legrégebbi korban, az uráli korban használt nyelvekben is voltak kölcsönzött szótövek. Így egyöntetűen indoeurópai eredetűnek tekintik az uráli korból öröklött száz (szanszkrit satam) vagy az árva (szanszkrit arbhasz 'kicsi, gyenge, fiatal') szót. 

Az uráli (vagy annak részeként a finnugor, illetve ugor) eredetű magyar szótövek összetétele nem meglepő, éppen olyan szócsoportokba tartoznak, amik a jelentésüknél fogva más nyelvcsaládokban is hosszú életűek szoktak lenni. Bárczi Géza például a következő szócsoportokat sorolja fel (csak néhány példáját emelem ki): 

  1. névmások (pl. én, te, ő, mi, ti, ki, mi, ho-); 

  2. egyszerű számok (pl. egy, kettő, három, négy); 

  3. testrészek (pl. fej, szem, fül, száj, nyelv, fog, szív); 

  4. rokonság (pl. atya, anya, fiú, öcs, nő, meny); 

  5. természeti tárgyak és jelenségek (pl. ég, villám, éj, hajnal, tél); 

  6. állatvilág (pl. daru, fecske, holló, lúd, hal); 

  7. növényvilág (pl. gyökér, tő, kéreg, fa); 

  8. ásványok (pl. kő, vas, arany); 

  9. lakás, eszközök, fegyverek, ruházat (pl. ház, fal, lakik, ajtó, ágy, kés, nyíl, nyereg, szíj); 

  10. táplálkozás (pl. fazék, lé, kenyér, fő, süt); 

  11. helyzet (pl. el, al, le, mög, bal); 

  12. elemi jelenségek, cselekvések, érzékelés (pl. val-, él, hal, alszik, hál, kel, fúj, nyel, fél, kell, kér, jön); 

  13. tulajdonság, mennyiség (pl. ifjú, új, vén, kemény, szomorú, hosszú). 

Ezzel szemben a legrégebbi magyar szókincs legnagyobb idegen rétegét alkotó ótörök eredetű szótövek csoportja egészen más összetételű. A hangtani bizonyítékok azt mutatják, hogy az ugor, majd az ősmagyar korban többféle ótörök nyelvváltozattal és több időszakból is származnak jövevényszavak, de ezek közül csak egy-két olyan van, ami a legalapvetőbb szókincshez sorolható (ilyen például a szakáll, és talán a nyak és a nyár is, de ez utóbbiak ótörök eredete erősen vitatható). Az ótörök jövevényszavak döntően ún. műveltségi szavak, tehát olyasmiket jelölnek, amiket feljebb kulturális újításnak neveztem. Így például (megint Bárczi Géza alapján): 

  1. állattenyésztés (pl. bika, ökör, borjú, kos, disznó, sajt, túró); 

  2. földművelés (pl. tarló, búza, eke, gyümölcs, alma, körte); 

  3. lakóhely (pl. sátor, karó, kút, kapu); 

  4. eszközök, mesterségek (pl. gyűszű, gyárt, csavar, ács, szűcs); 

  5. öltözködés (pl. saru, csat, gyöngy, gyűrű, tükör); 

  6. társadalmi szervezet (pl. sereg, béke, törvény, tanú, bér); 

  7. vallásos élet, hiedelmek (pl. táltos, bölcs, boszorkány, báj, sárkány). 

Keveréknyelv-e a magyar?

Keveréknyelvek csak nagyon speciális körülmények között alakulnak ki. 

A nyelvekben a történetüktől függően változó mennyiségű kölcsönzött szótő van. Már említettem az angol példáját, amibe a normann hódítás idején számtalan francia szótő került; hasonló például a perzsa (farszi) esete, amibe az iszlamizálás miatt rengeteg arab szótő került, és rengeteg más példa is van. Az ilyen nyelvekkel kapcsolatban időről időre felvetik, hogy nem tekinthetők-e keveréknyelvnek, vagyis egyfajta kreol nyelvnek. (A kreol nyelvek a következőképpen alakulnak ki. Először több nyelvből vett eszközökkel kialakul egy közvetítő nyelv, egy ún. pidzsin, ami szigorú értelemben nem is nyelv, csak valamiféle kommunikációs rendszer. Aztán ha a pidzsin nyelv már újabb generációk anyanyelvévé válik, és ezért kialakul a „szabványos” eszköztára, az így létrejövő nyelvet kreol nyelvnek nevezzük.) 

A keveréknyelvek eredete tehát mindig olyan kommunikációs rendszer, amit pidzsinnek nevezünk, és amire az jellemző, hogy a beszélői felnőttkorukban kerülnek be egy közösségbe, és ott kénytelenek valahogy szót érteni egymással. Ezért csak nagyon sajátos esetekben alakul ki ilyen, leginkább kikötőkben, soknemzetiségű menekülttáborokban, régen olyan gyarmatokon, ahol felnőtt rabszolgák kerültek be a közösségbe, és így tovább. Ha viszont egy gyerek beleszületik egy többnyelvű közösségbe, akkor nem keverni fogja az ott beszélt nyelveket, hanem mindegyiket (vagy legalábbis a számára fontosabbakat) külön-külön nyelvekként megtanulja. Lehet, hogy a szókincsüket némileg keverve fogja használni (mert a szókincs a legváltozékonyabb része a nyelvnek, és mert feltehetően maguk a közösség eltérő anyanyelvű beszélői is átvesznek szótöveket egymástól), de a többi nyelvi eszköz meghatározó, döntő részét (pl. a ragozást és más nyelvtani elemeket) meg fogja különböztetni egymástól. Erről feljebb már szóltam, amikor a toldalékok kölcsönzésének ritkaságáról beszéltem. Gondoljunk csak arra, hogy a hatalmas francia hatás ellenére az angol nyelv például egyetlen elöljárószót sem vett át a franciából. Ezzel szemben a keveréknyelvekre az jellemző, hogy a nyelvtani eszközök (toldalékolás, elöljárószók vagy névutók, szórend stb.) nagyjából egyforma arányban származnak az alapul szolgáló különböző nyelvekből. 

Különleges eset az, amikor közeli rokon nyelveket beszélők élnek szoros kontaktusban vagy kétnyelvűségben. Ilyenkor az alaki hasonlóság és a hasonló elrendezések miatt sokkal könnyebben keverednek akár a nyelvtani eszközök is – így jöttek létre például Dél-Amerikában spanyol–olasz és spanyol–portugál keveréknyelvek. De például az ott beszélt bennszülött nyelvekkel ilyen jellegű keveredés nem volt, azoknak az esetében csak szótövek átvétele történt meg (bármelyik irányban), ezért ilyen keveréknyelvek nincsenek. Hadd jegyezzem meg még azt is, hogy a közeli rokon nyelvek könnyű keveredése nehezíti meg sokszor a nyelvek leszármazási viszonyainak tisztázását, sőt, emiatt sokszor egyáltalán nem értelmes a szokásos értelemben vett „nyelvcsaládfáról” beszélni, mivel egyetlen nyelv sokszor egyszerre több közeli rokonnyelvnek, nyelvváltozatnak a leszármazottja. 

A magyar nyelv a keveréknyelveknek semmilyen vonását nem mutatja. 

Annak ellenére, hogy nagyjából egyetértés van a kutatók (nyelvészek, régészek stb.) között abban, hogy a magyar népesség viszonylag hosszú időn át magyar–török kétnyelvűségben élhetett, ennek nyelvi hatása nem olyan jellegű, mint amit a keveréknyelvekben megfigyelhetünk. A szókincsen kívül (amiről láttuk, hogy csak mérsékelten mérvadó) gyakorlatilag nincsenek olyan nyelvi eszközök a magyar nyelvben, amiknek a kialakulását török hatásnak lehetne tulajdonítani, annak ellenére, hogy kétnyelvűségben élő népek esetében még ilyesmin se lehetne csodálkozni, keveréknyelveknél pedig feltétlenül igaz, hogy a nyelvtani eszközök is többféle eredetűek. 

Köszönet Sipos Máriának (MTA Nyelvtudományi Intézet) a cikkhez nyújtott segítségért.

A szerző nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa. A Qubit.hu-n megjelent írásai itt olvashatók  

Kapcsólódó cikkek a Qubiten:

Magyar kutatók titkos élete: nappal tudós, este bűvész

Kevesen gondolnák, hogy a magyar tudományos élet prominens képviselői szabadidejüket bűvésztrükkök gyakorlásával és előadásával töltik. Összeegyeztethető a megtévesztésen alapuló varázslás a tényeket szentként tisztelő tudománnyal? Gáspár Merse Előd fizikus és bűvész négy elismert magyar kutatóval beszélgetett a nagy trükkről.