Berakta a szöllőt a hüttőbe – a beszéd csodálatos szimfóniája

A politikusokat tényekkel kell szembesíteni. A tudomány tényeket gyárt. Segíts minél többet publikálni belőlük!

Az emberiség évezredek óta él abban a naiv elképzelésben, hogy a beszédje nem más, mint beszédhangok sorozata. Ezt tükrözik a mindenfelé elterjedt (bár nem kizárólagos) hangírások (az első tudtommal a görög volt), amikben minden írásjegy nagyjából egy-egy hangnak (nem pedig egy szótőnek, egy toldaléknak vagy egy szótagnak) felel meg. A nyelvészek azonban már legalább az 1980-as évek óta nem így ábrázolják azt, ami elhangzik.

Világos ellenpélda: a dallamok

Persze ha egy kicsit belegondolunk, könnyen találunk ellenpéldát arra, hogy a beszéd hangok sorozatára redukálható. Hiszen nyilvánvaló, hogy például a beszédhangunk magasságát a beszédszerveink működésétől szinte függetlenül tudjuk változtatni, és ezt ki is használjuk. A magyarban például egyedül a mondat dallamával különbséget tudunk tenni a kijelentő mondatok és az eldöntendő kérdések között: Megetette a majmot. Megetette a majmot? Az első mondatot ereszkedő dallammal ejtjük: az ereszkedés a hangsúlyos szótagon vagy szótagokon indul (ha csak egy hangsúllyal ejtjük, akkor a mondat első szótagján, ha meg a majmot szót is hangsúlyozzuk, akkor onnan is indul egy ereszkedő dallam). A második mondatot egy emelkedő dallammal indul, ami egészen a majmot első szótagjáig emelkedik, ott éri el a csúcsot, majd az utolsó szótagot ehhez képest hirtelen eséssel sokkal alacsonyabb magasságon ejtjük.

A tájékozottabbak azt is tudják, hogy a világon mindenfelé vannak ún. tonális nyelvek, ahol a dallamot nem mondatok, hanem szavak megkülönböztetésére használják: az egyes szavaknak saját dallamuk van, amit ugyanúgy meg kell tanulni velük együtt, ahogy mondjuk a németben a főnevek nemét. Például a Kenyában beszélt kikuju nyelvben (ami a niger-kongói nyelvcsalád bantu ágához tartozik) az aka szó azt jelenti, hogy `asszonyok', ha mindkét magánhangzóját alacsonyan ejtjük, de azt jelenti, hogy `épít', ha az első magánhangzóját magasan. Az ira szó azt jelenti, hogy `tegnap', ha mindkét magánhangzója alacsony, míg azt, hogy `hó', ha a második magánhangzója eső–emelkedő dallamú. Az ilyen nyelvekben a szavakat majdnem mindig ugyanazzal a hozzájuk tartozó dallammal ejtik, hacsak valami nyelvtani szabályszerűség közbe nem lép. Például a kikujuban a he szó azt jelenti, hogy `ad', ha alacsony a magánhangzó dallama, viszont `ad nekem' a jelentése, ha magas. De ilyesmi magukkal a beszédhangokkal is előfordul, például a magyarban a kapa szó végén nem mindig a-t ejtünk, a legtöbb rag előtt á-t.

A beszédünknek tehát a beszédhangok sorozatán kívül még legalább egy összetevője van, a dallam. Úgy is mondhatjuk, hogy ez egy másik szólam, mint a beszédhangok sorozata. A zenei párhuzam sok szempontból találó, elsősorban azért, mert a beszédszervek két egymástól független működéséről van szó, amiket ugyanakkor egymással szinkronizálunk, legalábbis annyiban, hogy vannak kritikus pontok, amikor illeszkedniük kell a szólamoknak (például amikor a magyarban éppen egy bizonyos szótagnál kell lennie a dallam csúcsának). Tulajdonképpen ugyanígy külön szólamnak tekinthetnénk a hangsúlyt is, ami szintén független mind a beszédhangok képzésétől, mind a dallamtól, és velük szinkronizálva használjuk.

Annak, hogy a dallam önálló szólam, látványos jelei vannak a legkülönbözőbb nyelvekben. A magyarban megfigyelhetjük, hogy az eldöntendő kérdés emelkedő–eső dallamát a kérdés szótagszámától függetlenül „elénekeljük”, csak az a lényeg, hogy a dallam csúcsa az utolsóelőtti szótagon legyen (egy- és kétszótagúaknál meg az utolsón). Vagy például az említett kikuju nyelv történetében lezajlott egy olyan változás, aminek a lényege az volt, hogy a szavak dallama egy szótaggal jobbra (későbbre) tolódott.

Mikropartitúrák

A dallam csak a leglátványosabb szólam az emberi beszédben, mert a hangszálainkkal kibocsátott zenei hangot a többi beszédszervünktől teljesen függetlenül tudjuk vezérelni. De az igazság az, hogy valamennyire az egymástól nem teljesen független beszédszerveinket is tudjuk külön-külön vezérelni, és egymással koordinálni, szinkronizálni. Ezt valahogy úgy képzelhetjük el, mint a zongorista ujjait, amik nem tudnak bizonyos távolságnál nagyobbat átfogni, de azért külön-külön mozognak.

Grafika: Tóth Róbert Jónás

A legfontosabb emberi beszédszervek az ajkak, az állkapocs, a nyelv, a nyelvcsap (ez képes elzárni és kinyitni a levegő útját a szájüregből az orrüregbe) és a garat izmai, meg persze a hangszalagok. Hogy egy példát mondjak a független működésükre, vegyük a zöngétlen zárhangokat (a magyarban ezek a p, t és k). Ezekre mind az jellemző, hogy a szájüreget valahol elzárjuk (a p esetében az ajkainknál, a t esetében a nyelvünkkel a felső fogsorunk mögött, a k-nál pedig a nyelvünk hátuljával a szájpadlásunk hátsó részén). Közben a nyelvcsapunkkal elzárjuk az orrüregünket, hogy teljes legyen a zár, és a hangszálainkat nem rezegtetjük, hogy zöngétlenek legyenek. A levegő a tüdőnkből áramlik kifelé, a zár miatt növekszik a nyomása a szájüregünkben, egészen addig, amíg ki nem engedjük a zár felpattintásával. Ha ezután a hang után például magánhangzó következik (pl. pa, ta, ka), akkor ezzel egyidejűleg a hangszalagunkat is megszólaltatjuk. Ez azért szükséges, mert a magánhangzók lényege a szabályos rezgés, amit a hangszalagunk idéz elő, és a hang minőségét az határozza meg, hogy ezt az alaprezgést hogyan modulálja a szájüregünk alakja.

Ebben az egész folyamatban kulcsszerepe van a zárfelpattanás és a zöngemegszólalás szinkronizálásának. Tehát itt is két külön szólamról beszélhetünk: az egyik szólam a zárképző izmainké, a másik pedig a hangszálaké. Ne vegyük magától értetődőnek, hogy a kettőnek feltétlenül szinkronban kell működnie, csak mert a magyarban ezt szoktuk meg. A világ rengeteg nyelvében nyelvi jelentősége van annak, hogy egyszerre történnek-e ezek a dolgok. Például rengeteg nyelvben fontos különbség van a magyar p, t, k-hoz hasonló zöngétlen zárhangok között, és azok között, amiknél a hangszalagok megrezgetése nem egyidejű a zár felpattanásával, hanem követi azt. Próbáljuk csak meg, úgy fogjuk hallani, mintha a zárhangot egy rövid h követné: pha, tha, kha. Ezeket a nyelvészek hehezetes hangoknak nevezik, és egyáltalán nem egzotikusak, hanem igencsak gyakoriak. Például a Magyarországon is beszélt romani, vagyis oláhcigány nyelvben is léteznek ezek a beszédhangok, és szembenállnak a sima p, t, k-val: mást jelent a ker `csináld', mint a kher `ház'.

Kicsit ritkább, de elszórva szintén a világ minden táján megtalálható a zöngétlen zárhangoknak az a képzése, amikor a hangszalagok nemcsak elhallgatnak, hanem be is záródnak, így a tüdőnkből kiáramló levegő nem tudja növelni a légnyomást a szájüregben, azt csak a szánk alakjával tudjuk növelni, és így pattintjuk fel a zárat. Ettől még nem hallanánk igazán mást, mint a mi p, t, k hangjainknál, de még ráadásul nem is szinkronizálják a hangszalagok megnyitását, hanem késleltetik a zár felpattanásához képest. Az ilyen hangokat a nyelvészek ejektíváknak nevezik. Például a grúz (vagy ma úgy kell mondani, hogy georgiai?) nyelvben egyáltalán nincsenek a magyarhoz hasonló p, t, k hangok (bár az ejektívákat sokszor ilyennek halljuk, különösen, ha nem magánhangzó előtt állnak), hanem csak hehezettek és ejektívák. Náluk tehát sosincs szinkronizálva a zár felpattanása és a hangszálak megnyitása (plusz a zönge kezdete).

Mindezeket a (számunkra) furcsa hangképzéseket nem tudnánk rendesen jellemezni, ha nem úgy fognánk fel a beszédszerveinket, mint amik külön-külön „több szólamban” tudnak működni. Az egyes szólamok, ahogy a partitúra egyes hangszercsoportjai, más-más dolgokra képesek. A hangszalagok például bezáródni, kinyílni, rezegni és rezgés nélkül összeszűkülni tudnak, a nyelvcsap nyitni és zárni tudja az orrüreget (plusz rezegni, a „raccsolva” ejtett r-nél), az ajkaink közeledni, bezáródni, széthúzódni, csücsöríteni, és így tovább. De ez önmagában csak annyit indokolna, hogy az egyes beszédhangok képzését így magyarázzuk el, ettől még fenntarthatnánk azt a régesrégi intuíciónkat, hogy a beszédünk (legalábbis a szegmentális része, ahogy feljebb magyaráztam) beszédhangok sorozata. Csakhogy többről van szó, mint az egyes beszédhangok felépítése. Arról is szó van, hogy az egymás mellett álló (vagy egymás közelségébe kerülő) beszédhangok egy-egy szólama összefügghet egymással. Erről lesz szó a következő pontban.

Szólamokkal leírható jelenségek

A hangtani jelenségek partitúraszerű ábrázolását a nyelvészetben (nagyon szerencsétlen, szinte érthetetlen elnevezéssel) autoszegmentális ábrázolásnak nevezik, és ma már senki sem kérdőjelezi meg, hogy ez eddig a legjobb ábrázolás. A segítségével nagyon egyszerűen és egymáshoz is hasonlóan ábrázolható és megérthető egy csomó hangtani jelenség. Az első helyen mindig a hasonulások teljes körét szokták említeni.

Minek köszönhetők a hasonulások? Nyilván annak, hogy ha két szomszédos hang tulajdonságai között sok az eltérés, akkor sok mindent kell tennünk a beszédszerveinkkel akkor, amikor az egyikről a másikra váltunk. Ha nem érvényesítünk minden köztük levő eltérést, akkor egyszerűbbé válik a kiejtésük, és ezt hívjuk hasonulásnak. Például a magyarban az egymás mellé kerülő zárhangok és réshangok kiejtésénél nem változtatunk a zöngésségen, hanem már az elsőnél megkezdjük a zönge képzését, ha az utolsó zöngés (vagy már az elsőt is zöngétlenül képezzük, ha az utolsó zöngétlen). Így azt, hogy mustban, úgy ejtjük ki, hogy a zöngét már az s képzésénél elindítjuk, és onnantól az egész szó képzése alatt fenntartjuk. Hasonlóképpen azt, hogy hozd ki, úgy ejtjük, hogy a zöngésséget már a z kiejtésénél felfüggesztjük, meg a d képzése alatt sem indítjuk el, csak a után.

A magyarban egy másik fajta hasonulást is megfigyelhetünk, amikor két egymás mellé kerülő mássalhangzónál a képzés helye közötti eltérést nem érvényesítjük. Ezt csak akkor tesszük meg, ha az első mássalhangzó n vagy m (az északi dialektusban, például a Felvidéken akkor is, ha ny), és közvetlenül utána egy tőle eltérő helyen képzett mássalhangzó áll. Ilyenkor a nyelvünk kezdettől fogva elfoglalja azt a helyet, ami az utána következő mássalhangzó képzéséhez szükséges, például általában így ejtjük olyan kifejezésekben, mint van kettőhárom van, és mindig így ejtjük egy szón belül: munka, hamvas.

A hasonulást tehát nagyon egyszerű időzítésbeli jelenségnek tekinteni: egy szólamban korábban kezdünk el (vagy hagyunk abba) valamit, ha hátrafelé ható hasonulásról van szó, illetve később, ha előre hatóról. De vannak más jelenségek is, ahol minden a szinkronizáláson múlik. Például sokszor angol anyanyelvűek nympf-nek írják le a `nimfa' jelentésű szót, amit a helyesírás szerint nymph-nek kell írni, és nagyon sokszor ejtik prinsz helyett printsz-nek azt, amit prince-nek írnak. Ilyenkor majdnem ugyanaz történik, mint a hasonulásnál: a m és a f vagy a n és a sz közötti eltérések érvényesülnek ugyan, de nem egyszerre, szinkronizálva váltunk, hanem két lépésben: először úgy fejezzük be az orrhangú mássalhangzó (m vagy n) képzését, hogy a nyelvcsappal bezárjuk az orrüregbe vezető csatornát, és megszüntetjük a zöngét. Ez p, illetve t jellegű hangot eredményez, és csak ezt követi a zár megszüntetése (nem teljesen nyílik ki, csak réssel váltjuk fel: f, illetve sz). Az eredmény olyan, mintha „beszúrtunk volna” egy zárhangot, és ha nem szólamokban gondolkoznánk, akkor csak ennyit tudnánk róla mondani. Hasonló folyamatok számos nyelvben megfigyelhetők, sokszor történeti változások formájában.

Szintén a szólamokkal és az időzítésekkel szokták magyarázni az ún. pótlónyúlás jelenségét is. Ez azt jelenti, hogy ha egy hangot nem ejtünk ki (mintha a partitúrában az egyik szólam szünetet tartana), attól még az időzítési tulajdonságai megmaradhatnak, és ilyenkor a többi szólam előbb vagy később lép be, hogy kitöltse a szünetet. Például számos magyar nyelvjárásban (és sokak egyéni nyelvváltozatában) kimarad az l hang képzése a zárt szótag végén (a nyelv nem érinti a szájpadlás elülső részét), viszont „cserébe” hosszú az előző magánhangzó: volt helyett vótzöld helyett ződ. Ilyenkor a nyelvünk szünetet tart a magánhangzó után, és ezt a szünetet a magánhangzó tölti ki. Vagy például a nyugati nyelvjárásban a hosszú magánhangzókat sokszor röviden ejtik, és ilyenkor a második részük helyét a következő mássalhangzó előrehozott ejtése tölti ki, ami hosszú mássalhangzót eredményez: szőlő helyett szöllőhűtő helyett hüttőkerítés helyett kerittés stb.

A legérdekesebbek talán azok a jelenségek, amikben mégcsak nem is közvetlenül szomszédos beszédhangok vannak érintve. Ilyen például a sokféle harmónia (illeszkedés), ami azt jelenti, hogy sok nyelv szereti, ha egy tartományon (mondjuk egy szón) belül bizonyos hangok bizonyos tulajdonsága nem nagyon változik. Például ilyen a rengeteg nyelvben (a magyarban is) megfigyelhető magánhangzó-harmónia, amikor egy szón belül lényegében minden magánhangzónak azonosnak kell lennie egy bizonyos tulajdonság tekintetében (a magyarban ez a tulajdonság az elöl-, illetve hátulképzettség: a szemezgetés végig elölképzett, a borozgatás meg végig hátulképzett magánhangzókból áll). Annak ellenére, hogy felváltva ejtünk magán- és mássalhangzókat, tehát az illeszkedő magánhangzók nem közvetlenül szomszédosak, törekszünk arra, hogy a szavak a magánhangzók elöl-, illetve hátulképzettsége szempontjából egységesek legyenek (már amennyire ezt a szókészlet, a nyelvtan meg a szokások lehetővé teszik). Ez megkönnyíti annak a felismerését, hogy hol kezdődnek és hol végződnek a szavak, meg takarékosabb is, mert nagyon gyakran a mássalhangzók képzése sem zavarja azt, hogy a nyelvünk helyzete (elülső vagy hátsó domborulata) nagyjából hasonló maradjon a szó képzése alatt. Egyszerűen magyarázható ez a tendencia, ha a nyelv helyzetét önálló szólamnak tekintjük.

Ha egy kicsit tovább feszítjük a szólam fogalmát (és a nyelvészek ezt meg is teszik), még azt a fajta jelenséget is a többszólamúsághoz sorolhatjuk, hogy sok nyelvben bizonyos szavak ritmikai képletei állandóak. Ritmikai képleten olyasmit értek, ami meghatározza, hogy egy szó mássalhangzóit és magánhangzóit milyen sorrendbe kell rakni, és milyen hosszúaknak kell ezeknek lenniük. Például a Kaliforniában beszélt miwok nyelvben minden igetőnek van legalább háromféle változata (aszerint, hogy milyen toldalékok járulnak hozzá), és ezeket az eltérő ritmikai képletük különbözteti meg egymástól. Például a `beleütközik' jelentésű ige tövének ez a három változata kowat-, kowwat- és kowta-, míg a `kér' jelentésű igének hasul-, hassul- és haslu. Jól látható, hogy bár a mássalhangzók és a magánhangzók sorrendje állandó (k-w-t plusz o-a, illetve h-s-l plusz a-u) az elrendezésük és a hosszúságuk képletenként más. Ennek alapján azt mondhatjuk, hogy külön szólamot alkot a ritmikai képlet, és külön szólamokat maguk a beszédhangok. Még a mássalhangzóknak és a magánhangzóknak is két külön szólamban kell lenniük, bár ez a két szólam sosem szólal meg egyszerre. Ezt úgy szoktuk lejegyezni, hogy a ritmikai képlet szólamában CVCVC, CVCːVC, illetve CVCCV szerepel, ahol „C” jelöli a mássalhangzókat, „V” a magánhangzókat (csak azért különböztetjük meg a jelüket, hogy látni lehessen, hogyan vannak szinkronizálva), és a „ː” a hosszúság jele. A mássalhangzók és a magánhangzók szólama olyan, mint ahogy a példákban írtam: k-w-t plusz o-a, illetve h-s-l plusz a-u.

Az ilyen ritmikai képletek sokaságáról híresek a sémi nyelvek (így például az arab és a héber) is, de ezekben az igék tövei még a magánhangzókat sem határozzák meg teljes mértékben. Például a bibliai héberben a legtöbb cselekvést jelentő ige jelöletlen ritmikai képlete (múlt időben, egyes szám harmadik személyben) CaCaC (pl. lamad `tanult'), míg a műveltető-okozó jelentésű tő CiCːeC képletű (pl. limmed `tanított'). De még a magyarban is van hasonló jelenség. Például van egy olyan igetípus, aminek σul/σül a képlete (itt a „σ” azt jelenti, hogy bármilyen szótag), az -ul/-ül pedig a `valamilyenné válik' jelentésű képző. Ehhez a képlethez igazodnak a kékül, barnul, szépül stb. igék. A fontos az, hogy ezek a képzett igék mindig kétszótagosak (néhány kivétel van, pl. alkonyul; azokat a nyelvújítás idején alkották mesterségesen). Ha olyan a melléknév, hogy nem tudunk belőle így képezni hasonló jelentésű igét, akkor egy másik képletet használunk: σσ…odik/σσ…edik/σσ…ödik, pl. gombásodik, feketedik, gömbölyödik stb.

A szerző nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa. A Qubit.hu-n megjelent írásai itt olvashatók