A nyelv és a fogalmak

A fogalmak mibenléte

Az előző részben szóltam arról, hogy mit értenek fogalmon a hagyományos európai közgondolkozásban: tulajdonságok összességét, amelyeknek egy részét a fogalom a fölérendelt fogalmától (a genus proximumától) „örökli”, a másik részük pedig megkülönbözteti a főfogalom többi alárendelt fogalmától (ezek alkotják a differentia specificáját). Ez a felfogás egy ún. generikus hierarchiát, más szóval taxonómiát határoz meg a fogalmak között, ami olyan, mint például az élőlények osztályozása a biológiában. De ahogy a biológiában is többféle viszony van az élőlények között, nemcsak a taxonómikusak (például az egyik a másiknak a tápláléka, kártevője stb.), úgy a fogalmak körében is vannak más viszonyok, mint a taxonómikusak. De persze ezeket is a tulajdonságaiknak tekintik. 

Arról is volt szó az előző részben, hogy miért lenne fontos a fogalmak viszonyhálózatának a feltárása a mesterséges intelligenciában, és arról is, hogy ha automatikus módszerekkel akarjuk ezt a hálózatot felfedezni, akkor ehhez a legfontosabb információforrást az emberek által fogalmazott szövegek szolgáltatják. Ez azt jelenti, hogy a nyelv közvetítésével térképezhetjük fel a fogalmi hálózatot. 

Ez persze borzasztó bonyolult feladat, amivel rengetegen próbálkoznak manapság. A fogalmi hálózat felépítésekor tulajdonképpen a gyerekek megismerési folyamatát próbáljuk utánozni, de egyelőre borzasztó nehéznek látszik ez a feladat. Nemcsak azért, mert nagyon bonyolult a megismerési folyamat és maga az ember, aki végzi, hanem azért is, mert a gyerekek nemcsak nyelvi ingereket használnak erre, hanem mindenféle érzékszervi ingereket is, ráadásul azokat is jó alaposan feldolgozzák, nem csak pusztán felfogják. Így aztán a nyelvi elemekhez (szavakhoz, kifejezésekhez) nemcsak más nyelvi elemeket tudnak kapcsolni, hanem mindenféle látványbeli, hangbeli, tapintásbeli stb. élményeket is, ilyenek együtteseit és sorozatait, egész forgatókönyveket. Sőt, ma már azt is tudjuk, hogy igen hamar (talán velük született módon) szándékokat, célokat és ok–okozati viszonyokat is kapcsolnak a különböző forgatókönyvekhez. Ezeknek a folyamatoknak az utánzásától a mesterséges intelligencia még igen-igen távol van. 

Mielőtt rátérnék arra, hogy ennek ellenére hogyan próbálnak kizárólag nyelvi adatokból fogalmakat kinyerni, szólnom kell arról, hogy mi is a fogalmak státusa ezekben a próbálkozásokban. Sokan úgy gondolják, hogy a szövegeket azért használhatjuk a fogalomhálózat feltérképezésére, mert az emberi gondolkodásban (és így a beszéd és a megértés folyamatában is) a fogalmak játsszák a kulcsszerepet, a fogalom szónak abban az értelmében, mint amiről itt feljebb szóltam. Hát nekem erről különvéleményem van, és ezt el kell magyaráznom. 

Filozófiai kitérő: a fogalmak és én

Már ebben a rovatban is írtam arról, hogy a fogalmakat nem találom hasznos eszköznek a szavak jelentésének megragadásához. Valóban, úgy gondolom – amennyire én értem őket, Locke Értekezés az emberi értelemről és Wittgenstein Filozófiai vizsgálódások c. műveivel összhangban –, hogy súlyos kategória-sértés összekeverni mondjuk a gyógyszer szót a gyógyszerek fogalmával, és reménytelen kísérlet a szó használatának magyarázatát erre a fogalomra redukálni. Ez első látásra ellentmond annak, hogy a mesterséges intelligencia fontos részének tartom a fogalmak hálózatának feltérképezését, megragadását. 

Nos, azt én egyáltalán nem vonom kétségbe, hogy léteznek gyógyszerek (méghozzá többféle definíció szerint többféle gyógyszer-fogalom létezik), még ha nem hívjuk is mindegyiket annak, vagy más dolgokat is hívunk annak (nem is beszélve arról, hogy koronként mást és mást hívnak, hívtak így). A „gyógyszerségnek” különböző meghatározások szerint léteznek funkcionális és egyéb ismérvei, én csak éppen azt gondolom, hogy a nyelvhasználattal – ebben az esetben a gyógyszer szó használatával – az ilyen meghatározásoknak semmilyen aspektusa sincs teljes megfelelésben. És emiatt szerintem rosszul teszi az, aki a „gyógyszerség” mibenlétét abból próbálja meg kihámozni, hogy az emberek mikor mire mondták és mondják, hogy gyógyszer. 

Illusztráció: Tóth Róbert Jónás / qubit.hu

Azt gondolom, hogy a szó arisztotelészi értelmében vett fogalmak artefaktumok, tudatos emberi alkotások, és a fejünk nem ilyenekkel van benépesítve, legfeljebb csak annyiban ismerjük őket, amennyiben tanulmányaink során, explicit tanulás útján elsajátítjuk őket. Vagyis a „gyógyszerségnek” mint a szó hagyományos értelmében vett fogalomnak csak normatív meghatározása létezhet (vagyis meg kell állapítani, hogy milyen alapon tartozhat valami ehhez a fogalomhoz, és csak az így felállított normához képest beszélhetünk fogalmi értelemben gyógyszerekről), míg a nyelvhasználat nem normatív alapon áll, hanem szokásokon, képzeteken, asszociációkon, hasonlóságokon és más elmebeli jelenségeken alapul, ezért szükségszerű, hogy a kettő között csak laza kapcsolat állhat fenn. A fogalmi hálózat tehát a kutató ember műve, amivel valami olyasmit próbál megközelíteni – az emberi gondolkodás alapjául szolgáló mentális hálózatot –, ami természete szerint egészen más jellegű. 

Annak, hogy ezt a felfogásomat nagyon sokan nem fogadják el (mint ahogy Locke és Wittgenstein felfogását sem, vagy éppen azt tagadják, hogy én helyesen értelmezem az idézett műveiket), az egyik fő oka az, hogy leggyakrabban olyan példákat vizsgálnak, amikben a nyelvhasználat már szinte normatív jellegű, vagyis elég rendesen illeszkedik a normatív, pl. tudományos meghatározáshoz. Például a fa szó használata, amikor növényfajtát értünk rajta, egész rendesen megfelel annak a botanikai fogalomnak, amit ezzel a szóval szoktak megcímkézni. És a szó és a fogalom közeli rokonságát vallók (meg azok, akik éppenséggel azonosítják a fogalmakat a szavak jelentésével), ezeket tekintik tiszta eseteknek, és minden mást valami „rendellenességgel” próbálnak magyarázni. Márpedig szerintem ebben az esetben a „normális – rendellenes” megkülönböztetés valójában körkörös érvelés (közelebbről a klasszikusan petitio principii-nek nevezett érvelési hiba), mert önkényesen azt nevezik ki „normálisnak”, ami az elméleti előfeltevéseik szerint annak minősül. 

Mert ha például a fa helyett mondjuk a hozzá eléggé hasonlóan gyakori és közönséges kert szót vesszük, ott már azt fogjuk látni, hogy tudományos meghatározása alig létezik (talán néhány szakmában használják, de azt hiszem, más-más értelemben), a mindennapi életben teljesen bizonytalan az emberek megítélése arra nézve, hogy mitől lesz valami kert. (Ami nem zárja ki azt, hogy vannak helyek, amiket mindenki kert-nek nevezne.) Ha aztán elvontabb (az érzéki tapasztalatokhoz közvetettebb módon kapcsolódó) dolgokra utaló szavakat, vagy például akár csak a legegyszerűbb igéket (pl. tol, nyom, vezet), határozószókat (pl. még, talán, főleg) stb. nézzük, ott már kifejezetten bajban vannak az emberek a kritériumok meghatározásával, és a használatukban is hatalmas eltérések lehetnek köztük. Márpedig azt állítani, hogy az igék vagy a határozószók úgy általában „fogalmilag rendellenesek”, számomra abszurdnak tűnik, hiszen ha a beszédünk leggyakoribb alkotóelemei „fogalmilag rendellenesek”, akkor éppen a leggyakoribb és legalapvetőbb megnyilvánulásaink állandóan kommunikációs félrecsúszásokhoz vezetnének. Tehát a hagyományos értelemben vett fogalmaknak legtöbbször irrelevánsnak kell lenniük a kommunikáció szempontjából, kivéve talán a tudományos diskurzust – és ott valóban állandóan bele is ütközünk az eltérő terminológiából adódó kommunikációs zavarokba. 

Amikor tehát a fogalmi hálózatok mesterséges megragadását (modellálását), gépi tanulással való feltérképezését tárgyalom, vigyázok, hogy ne szavak közötti viszonyokról beszéljek. A gyógyszer szót és a hozzá hasonló címkéket én itt végig puszta címkeként, nem pedig a természetes nyelv ilyen hangzású szavaként használom. Azok a módszerek, algoritmusok pedig, amikről szó van, nem a nyelvhasználatot, hanem ezeknek a címkéknek a normatív tartalmát próbálják meg felderíteni, csak éppen jobb híján nem tudnak másból kiindulni, mint a nyelvhasználatból. Az önvezető autót nem az érdekli, hogy az út mentén álló tárgyat melyik nyelvhasználó mennyire nevezné inkább fának vagy inkább bokornak (cserjének), és miért, hanem az, hogy fel kell-e készülni arra, hogy eléugrik. 

A szerző nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa. A Qubit.hu-n megjelent írásai itt olvashatók  

Kapcsolódó cikk: