A nyelv szabályalapú megközelítése kicsit olyan, mintha csak indoklásokra kellene emlékeznünk, de az esetek többi részletére, a problémákra és a megoldásokra nem. Ezzel szemben az esetalapú megközelítés azt hangsúlyozza, hogy a túlzott általánosságnak súlyos hátulütői vannak, például nem teszi lehetővé a nyelvelsajátítás, a tévesztések vagy a nyelvi változás sok részletének magyarázatát.
Amikor az esetalapú okoskodásban az esetek adatbázisban precedenseket keresünk, viszonylag könnyű dolgunk van, mert csak azokat a hasonlóságokat kell figyelembe vennünk, amiknek igen magas a típusgyakorisága, vagyis amik nagyon sok eltérő precedensben játszanak fontos szerepet.
A 20. század nagy része a szabályrendszerek bűvöletében telt, de mostanra teljesen világossá vált, hogy ezek nem versenyképesek a példákból összefüggéseket automatikusan megtanuló rendszerekkel. Mire jó az esetalapú nyelvészet?
A precedensalapú okoskodás előfeltétele a korábbi tapasztalatok tárháza, vagyis egyfajta adatbázis, ami ezeket a tapasztalatokat valamilyen kereshető formában tartalmazza. Ha nagyon leegyszerűsítjük a dolgot, az egész nyelvelsajátítást ennek az adatbázisnak az építgetésével azonosíthatjuk.
Memória, referenciák, eljárások és az összetett adatok élettartama: Kálmán László kezében még fényesebben csillog a Rust!
A képzők, jelek és ragok megkülönböztetését és az iskolások helyzetét súlyosbítja, hogy a meghatározásuk többarcú, többszempontú, kicsit hasonlóan ahhoz, ahogy a fém használata más-más szempontokon alapul a fizikusok és a vegyészek körében.
A magyarban a -ba/-be már réges-régen betölti az általános határozóalkotó toldalék szerepét. Nem természetes, hogy ez a szerepe más esetekre is átterjedjen? Hát hogy a mennydörgős ménkűbe ne!
Az elemzés rettentő bonyolult dolog, és nem véletlenül nem értettem meg az iskolában, hogy mi az: sosem mondták el, de talán ha elmondták volna, akkor sem értettem volna – írja Kálmán László, az MTA nyelvésze, aki ennyi idő után végre megpróbálja megfejteni, mit akar a tanár, amikor elemezni kell.
A természetes nyelvben minden további nélkül megértünk olyan kifejezéseket, mint hogy „hallom a Szigetet”, holott hallani szigorúan véve csak hangot lehet, a Sziget pedig nem hang. De mi a helyzet a számítógépes programnyelvekkel?
A természetes nyelvek használatakor egyszerűen azért alkalmazkodunk a szokásokhoz, hogy megértsenek minket. Valahogy így kellene eljárnunk a számítógépes nyelvek esetében is, írja Kálmán László nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa.
Amikor a közlendőnket megfogalmazzuk, végső soron mindig a képzőművészethez hasonló tevékenységet végzünk – de művészi szinten, eredeti módon erre csak kevesen képesek, írja Kálmán László, az MTA Nyelvtudományi Intézetének főmunkatársa.
Ha ilyen nagy a különbség a programok és a természetes nyelvi kifejezések jelentéstana között, akkor lehet-e egyáltalán esélyünk arra, hogy „emberibb” nyelven írhassunk programokat?
Amikor fordítanak, az emberek a szoftverekkel ellentétben nemcsak a két nyelv szavainak, szerkezeteinek a megfeleléseit ismerik, hanem értik is, amit fordítanak. És hogy ez mit is jelent pontosan, hogyan is lehetne megragadni és felhasználni, arról egyelőre senkinek sincs fogalma. Nyelvészek nélkül nem is lesz.
Az önvezető autót nem az érdekli, hogy az út mentén álló tárgyat melyik nyelvhasználó mennyire nevezné inkább fának vagy inkább bokornak, és miért, hanem az, hogy fel kell-e készülni arra, hogy eléugrik, írja Kálmán László, az MTA nyelvésze.
A jog és akár a politika is megérett arra, hogy automatizálással segítsük a problémák megoldását, de ezekben már nyilvánvalóan a nyelvnek is fontos szerepe van. Sajnos a nyelvtudomány olyan lemaradásban van, hogy ezek a területek egyelőre a tudományos fantasztikum világához tartoznak, írja Kálmán László, az MTA munkatársa.
A szókincs a nyelvek legváltozékonyabb része, a naiv nyelvrokonítók mégis gyakran hivatkoznak rá. Pedig a régi magyar szótövek is az uráli örökségről tanúskodnak. Kálmán László, az MTA nyelvésze folytatja a bizonyítékok felvonultatását.
Miért olyan biztosak a nyelvészek a dolgukban, és mik azok a tényleges bizonyítékok, amik az uráli rokonságot megkérdőjelezhetetlenné teszik? Kálmán László, az MTA nyelvésze elkészítette a tökéletes puskát.
A rézedényt különíró harmadikos gyerek intuíciója az volt, hogy az anyagnevek jellemző módon nem annyira tárgyakra, mint tárgyak tulajdonságára utalnak. Kálmán László csak annyit mond, hogy nem biztos, hogy a kétféle intuíció között választani kell.
A gyerek alaposan végiggondolta az előtte álló problémát, kitalált egy megoldást, amit alapos indoklással alá is tudott támasztani. Erre mi történt? Ahelyett, hogy megdicsérték volna, szankciót foganatosítottak vele szemben, mert nem a dogmát böfögte vissza.
Mi a különbség a logikus és az analógiás gondolkodás között, melyik a háziorvosok kedvence, melyik irányba halad a mesterséges intelligencia, és hogy jön ide a holland kicsinyítő képző? Kálmán László rendet vág.
Vajon az elküldés is durva volt, vagy csak a leugatás? És ha már itt tartunk: meg lehet fogalmazni, hogy pontosan mi az a mondattan, azaz a szintaxis? Kálmán László, az MTA nyelvésze szkeptikus, de nem adja fel.
Bár a nagy mennyiségű adatokkal dolgozó big data technológiák sok mindenre képesek, jelentős emberi képességek utánzásától még nagyon távol állunk. Kálmán László, az MTA nyelvésze a felismerés után az osztályozás képességét vizsgálja.
Melyik programozási nyelv alkalmas a leginkább középhaladóknak és profiknak is? Kálmán László, az MTA nyelvésze bemutatja a Rustot.
Hogyan tudja a számítógép megkülönböztetni az embert a majomtól? Mi az híres a neurális háló, és hogyan tudsz magad is létrehozni egyet? Kálmán László, az MTA nyelvésze elmagyarázza.
Kálmán László, az MTA nyelvésze fogta magát, írt egy algoritmust, ami elemeikre bontja az összetett magyar szavakat, aztán ráeresztette másfél millió szóalakra. Hogy mi történt ezután?
Valóban szabad egy magyar mondat szórendje, pontosabban a mondatrészek sorrendje? Akkor miért nem mondunk olyat, hogy Mindig Jóska levitte a szemetet a szelektívbe? Kálmán László, az MTA nyelvésze elmagyarázza.
Ha alaposan megfontoljuk, hogy pontosan mit számolunk, miben mérjük a gyakoriságokat, és mit veszünk még számításba a gyakoriságokon kívül, olyan összefüggéseket is felfedezhetünk tisztán statisztikai alapon, mint a magyar magánhangzó-illeszkedés, amit pedig a nyers adatok szinte egyáltalán nem mutatnak.
A felhasználók számára írt programok, az alkalmazások, amiket nap mint nap használunk, nem puszta karaktersorozatokat jelenítenek meg, hanem szép színes képernyőket, ábrákkal, képekkel, klikkelhető elemekkel, amik sokszor még mozogni is tudnak.
A beszédünknek a beszédhangok sorozatán kívül még legalább egy összetevője van, a dallam. Úgy is mondhatjuk, hogy az egy másik szólam. Kálmán László elmagyarázza a hangzók képzését, a beszéd szólamait.
Milyenek a magyar mondatok, és hogyan magyaráznánk el őket egy külföldinek? Kálmán László, az MTA nyelvésze mondatfélékről, állítmányfélékről, igés szerkezetekról és a titokzatos Jóskáról, aki vagy be van rúgva, vagy be fog rúgni.
Létezik nyelvi evolúció? Fejlődik egyáltalán egy nyelv? És mi köze az emberek rokonságának a nyelvek rokonságához?
Akármilyen intenzív volt is az ősmagyar és az ótörök érintkezése, a magyarok nem adták fel az uráli nyelvüket (sőt, valószínűleg sok más nyelvet beszélő át is tért a magyar ősére), és a török hatás messze nem volt akkora, hogy az uráli rokonság megkérdőjelezhető legyen.
Feltűnő, hogy a nyelv felfogásában történő változás mennyire párhuzamos a gondolkodás felfogásában történővel. Kálmán László a nyelvészeti paradigmaváltás hátteréről.
Lőttök? Bealszik? Ráír? Hát-tal kezdett mondat? Kálmán László, az MTA nyelvésze nyelvi babonákról, mondvacsinált szabályokról, stigmatizált szokásokól, helyesről és helytelenről, deskriptív és preskriptív nyelvészetről, és arról, milyen nehéz a dolga ma egy pedagógusnak. Vágod?
A programok csak akkor tudnak igazán érdekesen viselkedni, ha kapcsolatba lépnek a külvilággal, ha adatokat tudnak onnan beszippantani, vagy oda kibocsátani; szakszóval úgy mondjuk, hogy adatokat beolvasni (input) és kiírni (output).
Hogyan kell azt elképzelni, amikor egy szóból csápok lógnak ki? És mit jelent az atomizmus és a holizmus, amikor a szavak „jelentéséről” beszélünk? Kálmán László, az MTA nyelvésze elmagyarázza.
Hogyan segíthet az információelmélet abban, hogy megtaláljuk, milyen szavak tartoznak szorosabban össze egy hosszú szövegben (a mondatokon belül), és alkotnak úgynevezett kollokációt?
Egészükben kellene szemlélnünk a vonzatos szerkezeteket, nem úgy, mint a Napot a bolygókkal, vagy az atommagot az elektronokkal. Mondhatjuk például, hogy elnevezésre méltó jelenségekre utaló állandósult szerkezettípusok.
Egyes részterületek megítélésében nagy viták vannak mondjuk a pszichológiában, a történettudományban vagy a szociológiában is, de arra a nyelvészeten kívül csak a filozófiában tudok példát, hogy a leírásnak szinte semmilyen eszközében nincs általános egyetértés.
Kezdjük a kukacoskodást azzal a kérdéssel, amit már az antik filozófusok is feltettek hasonló esetekben: vajon ugyanaz a lény maradt-e a kártyapaklink annak ellenére, hogy alaposan megváltoztattuk?
Miért nincs olyan, hogy „*Kétlem bejön”, csak olyan, hogy „Kétlem, hogy bejön”? Ennek megértésében segít a jelentéstan, a mondattan, de egy kicsit még a kiejtés is. Aki viszont elkülönült nyelvtani modulokban gondolkozik, nehezen definiálja a hogy elhagyhatóságát.
Hogy micsodák is a fogalmak, arról annyi sokat és különfélét mondtak már évezredek óta, hogy ezek után bátran állíthatjuk: fogalmunk sincs róluk.
Annyi biztos, hogy a programozásnak sok köze van a matekhoz, de az vitatható, hogy minden programozónak nagy matekosnak kellene lennie.
Hogy viselkedik az angolban az, hogy 'both'? És a magyarban az, hogy 'minden'? Kálmán László, az MTA nyelvésze rossz hírekkel szolgál azoknak, akik szabályokkal írják le a nyelvi szerkezeteket.
Miért butaság, hogy az ige „cselekvést, történést vagy létezést jelentő szó”? Hogyan segítenek a nyelvészeknek a kétszavas mondatok? Kálmán László, az MTA nyelvésze nem adja fel, tovább csoportosít.
A jelentés fogalmát nem célszerű a megértés sokféle menetéhez és mibenlétéhez kötni. Ezek szerint tehát valami máshoz kellene lehorgonyozni? Vagy hagyjuk meg ilyen lazának? Vagy mondjunk le róla teljesen?
Nagy bajban vagyunk: a magyar jog nagyon alapvető kérdésekben, a szövegek értelmezésében olyan fogalmakra épül, amiknek a leírását jól ellenőrizhető, tételes formában sehol sem találjuk meg.
Kálmán László megígérte, hogy befejezi a kártyákat megkeverő és kiosztó Java-programot, ezt most meg is teszi. De hogy ne csak favágás legyen, egy-két fogalmat is elmagyaráz azért.
Kálmán László, az MTA nyelvésze a Javában mutatja be, hogyan működnek a programozásban az osztályok és a modulok.
Hogyan lehet megállapítani, hogy melyik szófajba tartozik egy-egy szó? Minél többet tudsz a nyelvészetről, annál nehezebb.