A nyelv szabályalapú megközelítése kicsit olyan, mintha csak indoklásokra kellene emlékeznünk, de az esetek többi részletére, a problémákra és a megoldásokra nem. Ezzel szemben az esetalapú megközelítés azt hangsúlyozza, hogy a túlzott általánosságnak súlyos hátulütői vannak, például nem teszi lehetővé a nyelvelsajátítás, a tévesztések vagy a nyelvi változás sok részletének magyarázatát.
A 20. század nagy része a szabályrendszerek bűvöletében telt, de mostanra teljesen világossá vált, hogy ezek nem versenyképesek a példákból összefüggéseket automatikusan megtanuló rendszerekkel. Mire jó az esetalapú nyelvészet?
A precedensalapú okoskodás előfeltétele a korábbi tapasztalatok tárháza, vagyis egyfajta adatbázis, ami ezeket a tapasztalatokat valamilyen kereshető formában tartalmazza. Ha nagyon leegyszerűsítjük a dolgot, az egész nyelvelsajátítást ennek az adatbázisnak az építgetésével azonosíthatjuk.
Memória, referenciák, eljárások és az összetett adatok élettartama: Kálmán László kezében még fényesebben csillog a Rust!
A képzők, jelek és ragok megkülönböztetését és az iskolások helyzetét súlyosbítja, hogy a meghatározásuk többarcú, többszempontú, kicsit hasonlóan ahhoz, ahogy a fém használata más-más szempontokon alapul a fizikusok és a vegyészek körében.
A magyarban a -ba/-be már réges-régen betölti az általános határozóalkotó toldalék szerepét. Nem természetes, hogy ez a szerepe más esetekre is átterjedjen? Hát hogy a mennydörgős ménkűbe ne!
Az elemzés rettentő bonyolult dolog, és nem véletlenül nem értettem meg az iskolában, hogy mi az: sosem mondták el, de talán ha elmondták volna, akkor sem értettem volna – írja Kálmán László, az MTA nyelvésze, aki ennyi idő után végre megpróbálja megfejteni, mit akar a tanár, amikor elemezni kell.
A természetes nyelvben minden további nélkül megértünk olyan kifejezéseket, mint hogy „hallom a Szigetet”, holott hallani szigorúan véve csak hangot lehet, a Sziget pedig nem hang. De mi a helyzet a számítógépes programnyelvekkel?
A természetes nyelvek használatakor egyszerűen azért alkalmazkodunk a szokásokhoz, hogy megértsenek minket. Valahogy így kellene eljárnunk a számítógépes nyelvek esetében is, írja Kálmán László nyelvész, az MTA Nyelvtudományi Intézetének főmunkatársa.
Amikor a közlendőnket megfogalmazzuk, végső soron mindig a képzőművészethez hasonló tevékenységet végzünk – de művészi szinten, eredeti módon erre csak kevesen képesek, írja Kálmán László, az MTA Nyelvtudományi Intézetének főmunkatársa.
Ha ilyen nagy a különbség a programok és a természetes nyelvi kifejezések jelentéstana között, akkor lehet-e egyáltalán esélyünk arra, hogy „emberibb” nyelven írhassunk programokat?
Amikor fordítanak, az emberek a szoftverekkel ellentétben nemcsak a két nyelv szavainak, szerkezeteinek a megfeleléseit ismerik, hanem értik is, amit fordítanak. És hogy ez mit is jelent pontosan, hogyan is lehetne megragadni és felhasználni, arról egyelőre senkinek sincs fogalma. Nyelvészek nélkül nem is lesz.
Az önvezető autót nem az érdekli, hogy az út mentén álló tárgyat melyik nyelvhasználó mennyire nevezné inkább fának vagy inkább bokornak, és miért, hanem az, hogy fel kell-e készülni arra, hogy eléugrik, írja Kálmán László, az MTA nyelvésze.
A jog és akár a politika is megérett arra, hogy automatizálással segítsük a problémák megoldását, de ezekben már nyilvánvalóan a nyelvnek is fontos szerepe van. Sajnos a nyelvtudomány olyan lemaradásban van, hogy ezek a területek egyelőre a tudományos fantasztikum világához tartoznak, írja Kálmán László, az MTA munkatársa.
Vajon az elküldés is durva volt, vagy csak a leugatás? És ha már itt tartunk: meg lehet fogalmazni, hogy pontosan mi az a mondattan, azaz a szintaxis? Kálmán László, az MTA nyelvésze szkeptikus, de nem adja fel.
Bár a nagy mennyiségű adatokkal dolgozó big data technológiák sok mindenre képesek, jelentős emberi képességek utánzásától még nagyon távol állunk. Kálmán László, az MTA nyelvésze a felismerés után az osztályozás képességét vizsgálja.
Melyik programozási nyelv alkalmas a leginkább középhaladóknak és profiknak is? Kálmán László, az MTA nyelvésze bemutatja a Rustot.
Hogyan tudja a számítógép megkülönböztetni az embert a majomtól? Mi az híres a neurális háló, és hogyan tudsz magad is létrehozni egyet? Kálmán László, az MTA nyelvésze elmagyarázza.
Kálmán László, az MTA nyelvésze fogta magát, írt egy algoritmust, ami elemeikre bontja az összetett magyar szavakat, aztán ráeresztette másfél millió szóalakra. Hogy mi történt ezután?
Valóban szabad egy magyar mondat szórendje, pontosabban a mondatrészek sorrendje? Akkor miért nem mondunk olyat, hogy Mindig Jóska levitte a szemetet a szelektívbe? Kálmán László, az MTA nyelvésze elmagyarázza.
Ha alaposan megfontoljuk, hogy pontosan mit számolunk, miben mérjük a gyakoriságokat, és mit veszünk még számításba a gyakoriságokon kívül, olyan összefüggéseket is felfedezhetünk tisztán statisztikai alapon, mint a magyar magánhangzó-illeszkedés, amit pedig a nyers adatok szinte egyáltalán nem mutatnak.
A felhasználók számára írt programok, az alkalmazások, amiket nap mint nap használunk, nem puszta karaktersorozatokat jelenítenek meg, hanem szép színes képernyőket, ábrákkal, képekkel, klikkelhető elemekkel, amik sokszor még mozogni is tudnak.
A beszédünknek a beszédhangok sorozatán kívül még legalább egy összetevője van, a dallam. Úgy is mondhatjuk, hogy az egy másik szólam. Kálmán László elmagyarázza a hangzók képzését, a beszéd szólamait.
Milyenek a magyar mondatok, és hogyan magyaráznánk el őket egy külföldinek? Kálmán László, az MTA nyelvésze mondatfélékről, állítmányfélékről, igés szerkezetekról és a titokzatos Jóskáról, aki vagy be van rúgva, vagy be fog rúgni.
Létezik nyelvi evolúció? Fejlődik egyáltalán egy nyelv? És mi köze az emberek rokonságának a nyelvek rokonságához?
Akármilyen intenzív volt is az ősmagyar és az ótörök érintkezése, a magyarok nem adták fel az uráli nyelvüket (sőt, valószínűleg sok más nyelvet beszélő át is tért a magyar ősére), és a török hatás messze nem volt akkora, hogy az uráli rokonság megkérdőjelezhető legyen.
Feltűnő, hogy a nyelv felfogásában történő változás mennyire párhuzamos a gondolkodás felfogásában történővel. Kálmán László a nyelvészeti paradigmaváltás hátteréről.
Lőttök? Bealszik? Ráír? Hát-tal kezdett mondat? Kálmán László, az MTA nyelvésze nyelvi babonákról, mondvacsinált szabályokról, stigmatizált szokásokól, helyesről és helytelenről, deskriptív és preskriptív nyelvészetről, és arról, milyen nehéz a dolga ma egy pedagógusnak. Vágod?
Hogyan kell azt elképzelni, amikor egy szóból csápok lógnak ki? És mit jelent az atomizmus és a holizmus, amikor a szavak „jelentéséről” beszélünk? Kálmán László, az MTA nyelvésze elmagyarázza.
Hogyan segíthet az információelmélet abban, hogy megtaláljuk, milyen szavak tartoznak szorosabban össze egy hosszú szövegben (a mondatokon belül), és alkotnak úgynevezett kollokációt?
Egészükben kellene szemlélnünk a vonzatos szerkezeteket, nem úgy, mint a Napot a bolygókkal, vagy az atommagot az elektronokkal. Mondhatjuk például, hogy elnevezésre méltó jelenségekre utaló állandósult szerkezettípusok.
Egyes részterületek megítélésében nagy viták vannak mondjuk a pszichológiában, a történettudományban vagy a szociológiában is, de arra a nyelvészeten kívül csak a filozófiában tudok példát, hogy a leírásnak szinte semmilyen eszközében nincs általános egyetértés.
Kezdjük a kukacoskodást azzal a kérdéssel, amit már az antik filozófusok is feltettek hasonló esetekben: vajon ugyanaz a lény maradt-e a kártyapaklink annak ellenére, hogy alaposan megváltoztattuk?
Miért nincs olyan, hogy „*Kétlem bejön”, csak olyan, hogy „Kétlem, hogy bejön”? Ennek megértésében segít a jelentéstan, a mondattan, de egy kicsit még a kiejtés is. Aki viszont elkülönült nyelvtani modulokban gondolkozik, nehezen definiálja a hogy elhagyhatóságát.
Hogy micsodák is a fogalmak, arról annyi sokat és különfélét mondtak már évezredek óta, hogy ezek után bátran állíthatjuk: fogalmunk sincs róluk.
Annyi biztos, hogy a programozásnak sok köze van a matekhoz, de az vitatható, hogy minden programozónak nagy matekosnak kellene lennie.
Hogy viselkedik az angolban az, hogy 'both'? És a magyarban az, hogy 'minden'? Kálmán László, az MTA nyelvésze rossz hírekkel szolgál azoknak, akik szabályokkal írják le a nyelvi szerkezeteket.
Miért butaság, hogy az ige „cselekvést, történést vagy létezést jelentő szó”? Hogyan segítenek a nyelvészeknek a kétszavas mondatok? Kálmán László, az MTA nyelvésze nem adja fel, tovább csoportosít.
A jelentés fogalmát nem célszerű a megértés sokféle menetéhez és mibenlétéhez kötni. Ezek szerint tehát valami máshoz kellene lehorgonyozni? Vagy hagyjuk meg ilyen lazának? Vagy mondjunk le róla teljesen?
Nagy bajban vagyunk: a magyar jog nagyon alapvető kérdésekben, a szövegek értelmezésében olyan fogalmakra épül, amiknek a leírását jól ellenőrizhető, tételes formában sehol sem találjuk meg.
Kálmán László megígérte, hogy befejezi a kártyákat megkeverő és kiosztó Java-programot, ezt most meg is teszi. De hogy ne csak favágás legyen, egy-két fogalmat is elmagyaráz azért.
Kálmán László, az MTA nyelvésze a Javában mutatja be, hogyan működnek a programozásban az osztályok és a modulok.
Hogyan lehet megállapítani, hogy melyik szófajba tartozik egy-egy szó? Minél többet tudsz a nyelvészetről, annál nehezebb.
Itt az ideje, hogy a tettek mezejére lépjünk, és írjunk végre egy önálló, működő programot. A Kukucs az új Hello World.
Modul, interfész, implementáció: Kálmán László, az MTA nyelvésze ezúttal OCaml-ban programoz, és még házi feladatot is ad. De nem kell beküldeni!
A legtöbb nyelvész alábecsüli annak a jelentőségét, hogy mennyire eltérően viselkednek az egyes szavak, szócsoportok. Ha valóban aszerint osztályoznánk őket, hogy milyen környezetekben fordulnak elő, kis túlzással minden szó külön szófajt alkotna.
Kálmán László, az MTA Nyelvtudományi Intézetének munkatársa ismét kártyákkal bűvészkedik – ezúttal C-ben, illetve C++-ban. Csak a kezét figyeljék!
Már harmadik elemiben elvont nyelvtani kategóriákkal bombázzák a gyerekeket, amiknek szinte semmilyen szemléleti alapjuk nincs. Hagyjuk a mára teljesen elavult iskolai nyelvtant!
Mitől fog ugyanaz a program a különböző futásaikor más és más viselkedést mutatni? Kálmán László, az MTA nyelvésze Pascalban varázsol a Qubit hasábjain.
Végső soron minden programozási nyelvvel ugyanazt tudjuk megtenni, nem tökmindegy, hogy milyen nyelvet használunk? Nem egészen: van jó sok szempont, ami számíthat.