A nyelv szabályalapú megközelítése kicsit olyan, mintha csak indoklásokra kellene emlékeznünk, de az esetek többi részletére, a problémákra és a megoldásokra nem. Ezzel szemben az esetalapú megközelítés azt hangsúlyozza, hogy a túlzott általánosságnak súlyos hátulütői vannak, például nem teszi lehetővé a nyelvelsajátítás, a tévesztések vagy a nyelvi változás sok részletének magyarázatát.
Amikor az esetalapú okoskodásban az esetek adatbázisban precedenseket keresünk, viszonylag könnyű dolgunk van, mert csak azokat a hasonlóságokat kell figyelembe vennünk, amiknek igen magas a típusgyakorisága, vagyis amik nagyon sok eltérő precedensben játszanak fontos szerepet.
A 20. század nagy része a szabályrendszerek bűvöletében telt, de mostanra teljesen világossá vált, hogy ezek nem versenyképesek a példákból összefüggéseket automatikusan megtanuló rendszerekkel. Mire jó az esetalapú nyelvészet?
Mivel kellene foglalkozni a nyelvtanórákon? Miért idegesít minket más emberek nyelvhasználata? Épülhet-e nemzeti identitásunk nem nyelvi alapokra? És mennyire borús a magyar tudomány ege? A Qubit Podcast első adásában Kálmán László nyelvészt faggattuk.
Jean Berko Gleason 1958-ban alkotta meg a wugokat, hogy rájöjjön, hogyan tudnak ismeretlen szavakat toldalékolni a gyerekek. A fejlődési pszicholingvisztika szenzációjából 60 évvel később mém lett, a wugok tulajdonjogáról pedig nyelvészek és ügyvédek folytatnak késhegyre menő vitát.
A precedensalapú okoskodás előfeltétele a korábbi tapasztalatok tárháza, vagyis egyfajta adatbázis, ami ezeket a tapasztalatokat valamilyen kereshető formában tartalmazza. Ha nagyon leegyszerűsítjük a dolgot, az egész nyelvelsajátítást ennek az adatbázisnak az építgetésével azonosíthatjuk.
Memória, referenciák, eljárások és az összetett adatok élettartama: Kálmán László kezében még fényesebben csillog a Rust!
A képzők, jelek és ragok megkülönböztetését és az iskolások helyzetét súlyosbítja, hogy a meghatározásuk többarcú, többszempontú, kicsit hasonlóan ahhoz, ahogy a fém használata más-más szempontokon alapul a fizikusok és a vegyészek körében.
A magyarban a -ba/-be már réges-régen betölti az általános határozóalkotó toldalék szerepét. Nem természetes, hogy ez a szerepe más esetekre is átterjedjen? Hát hogy a mennydörgős ménkűbe ne!
Az elemzés rettentő bonyolult dolog, és nem véletlenül nem értettem meg az iskolában, hogy mi az: sosem mondták el, de talán ha elmondták volna, akkor sem értettem volna – írja Kálmán László, az MTA nyelvésze, aki ennyi idő után végre megpróbálja megfejteni, mit akar a tanár, amikor elemezni kell.
A maradjotthonka, a maszkdivat, a járványszett és a maszkot is magába foglaló trikini jellemzi leginkább a koronasikket! A home office-ban töltött napot feldobhatja a karanténkovászolás, az esti karantorna után pedig jöhet a karantinivel kísért covideo-party. Veszelszki Ágnes nyelvész szótárba rendezte a járvány alatt létrejött új szavakat.
A természetes nyelvben minden további nélkül megértünk olyan kifejezéseket, mint hogy „hallom a Szigetet”, holott hallani szigorúan véve csak hangot lehet, a Sziget pedig nem hang. De mi a helyzet a számítógépes programnyelvekkel?
A COVID-19 mozaikszót februárban alkották meg, egy hónappal később pedig már a Merriam-Webster szótárba is bekerült. Az informálás mellett közegészségügyi szerepe is van a járványhoz kötődő szavak terjedésének. Persze kérdés, hogy közülük melyiket használjuk majd még öt év múlva is.
Ha ilyen nagy a különbség a programok és a természetes nyelvi kifejezések jelentéstana között, akkor lehet-e egyáltalán esélyünk arra, hogy „emberibb” nyelven írhassunk programokat?
Amikor fordítanak, az emberek a szoftverekkel ellentétben nemcsak a két nyelv szavainak, szerkezeteinek a megfeleléseit ismerik, hanem értik is, amit fordítanak. És hogy ez mit is jelent pontosan, hogyan is lehetne megragadni és felhasználni, arról egyelőre senkinek sincs fogalma. Nyelvészek nélkül nem is lesz.
Nevet kaptak végre a csatornát eldugaszoló, zsírból és szemétből álló szörnyek; politikailag korrekt jelentésbővülésen ment át a they 'ők'; kanonizálták azt a szót, hogy szabadulószoba; az aputest után pedig megszületett az apuvicc kifejezés.
Egy nyelvészcsoport megmérte, hogy milyen nyelven mennyi információt tudunk közölni másodpercenként. Kiderült, hogy mindegy, hogy japánok vagy németek vagyunk, 39 bit az átlag.
A jog és akár a politika is megérett arra, hogy automatizálással segítsük a problémák megoldását, de ezekben már nyilvánvalóan a nyelvnek is fontos szerepe van. Sajnos a nyelvtudomány olyan lemaradásban van, hogy ezek a területek egyelőre a tudományos fantasztikum világához tartoznak, írja Kálmán László, az MTA munkatársa.
Az egyre pontosabb gépi fordítás már nemcsak angolról magyarra működik, de ismeretlen nyelveket is képes kezelni. Amerikai kutatók először fejtettek meg automatikusan egy több mint 3000 éves nyelvet.
Genetikai módszerekkel nem lehet nyelvtörténetet kutatni, ahogy a nyelvészeti eszközökkel sem lehet a genetikai ősökre következtetni. Ugyanakkor a populációgenetikai úton megtalált demográfiai szálak összeköthetik az őstörténetről szóló történeti-régészeti és nyelvészeti koncepciókat.
A ma magyarul beszélők ősei az Ural-hegység nyugati lábánál éltek, és onnan indultak útnak az első évezred második felében – támasztja alá egy most megjelent populációgenetikai kutatás a finnugor eredet nyelvészeti és régészeti érveit.
A gyerek alaposan végiggondolta az előtte álló problémát, kitalált egy megoldást, amit alapos indoklással alá is tudott támasztani. Erre mi történt? Ahelyett, hogy megdicsérték volna, szankciót foganatosítottak vele szemben, mert nem a dogmát böfögte vissza.
Mi a különbség a logikus és az analógiás gondolkodás között, melyik a háziorvosok kedvence, melyik irányba halad a mesterséges intelligencia, és hogy jön ide a holland kicsinyítő képző? Kálmán László rendet vág.
Ismét változatos témájú előadásokkal készültünk az évadnyitó, február 14-ei meetup-ra. A részvétel, mint mindig, ingyenes.
Vajon az elküldés is durva volt, vagy csak a leugatás? És ha már itt tartunk: meg lehet fogalmazni, hogy pontosan mi az a mondattan, azaz a szintaxis? Kálmán László, az MTA nyelvésze szkeptikus, de nem adja fel.
Az igazságtól a toxikusságig terjed a különféle tudományos műhelyek által kiválasztott év szavainak skálája.
Kálmán László, az MTA nyelvésze fogta magát, írt egy algoritmust, ami elemeikre bontja az összetett magyar szavakat, aztán ráeresztette másfél millió szóalakra. Hogy mi történt ezután?
Milyen lett volna, ha nyelvészek, robotok és rengeteg érdeklődő mellett te is beférsz a szülinapi Qubit Live-ra? Ilyen lett volna!
Az első Qubit-találkozón a gyerekeket optikai palackposta várta, a felnőttek pedig megtudhatták, hogy mi fán terem a nyelvtudományi neurális háló és az etorobot portás, továbbá kiderült, hogy a beszélő szándékainak kifürkészéshez kell-e metapragmatikai tudás. A szeánsz fénypontja az év embere díj átadója volt.
Ha alaposan megfontoljuk, hogy pontosan mit számolunk, miben mérjük a gyakoriságokat, és mit veszünk még számításba a gyakoriságokon kívül, olyan összefüggéseket is felfedezhetünk tisztán statisztikai alapon, mint a magyar magánhangzó-illeszkedés, amit pedig a nyers adatok szinte egyáltalán nem mutatnak.
A beszédünknek a beszédhangok sorozatán kívül még legalább egy összetevője van, a dallam. Úgy is mondhatjuk, hogy az egy másik szólam. Kálmán László elmagyarázza a hangzók képzését, a beszéd szólamait.
Milyenek a magyar mondatok, és hogyan magyaráznánk el őket egy külföldinek? Kálmán László, az MTA nyelvésze mondatfélékről, állítmányfélékről, igés szerkezetekról és a titokzatos Jóskáról, aki vagy be van rúgva, vagy be fog rúgni.
Akármilyen intenzív volt is az ősmagyar és az ótörök érintkezése, a magyarok nem adták fel az uráli nyelvüket (sőt, valószínűleg sok más nyelvet beszélő át is tért a magyar ősére), és a török hatás messze nem volt akkora, hogy az uráli rokonság megkérdőjelezhető legyen.
Feltűnő, hogy a nyelv felfogásában történő változás mennyire párhuzamos a gondolkodás felfogásában történővel. Kálmán László a nyelvészeti paradigmaváltás hátteréről.
Hogyan kell azt elképzelni, amikor egy szóból csápok lógnak ki? És mit jelent az atomizmus és a holizmus, amikor a szavak „jelentéséről” beszélünk? Kálmán László, az MTA nyelvésze elmagyarázza.
Hogyan segíthet az információelmélet abban, hogy megtaláljuk, milyen szavak tartoznak szorosabban össze egy hosszú szövegben (a mondatokon belül), és alkotnak úgynevezett kollokációt?
Miért nincs olyan, hogy „*Kétlem bejön”, csak olyan, hogy „Kétlem, hogy bejön”? Ennek megértésében segít a jelentéstan, a mondattan, de egy kicsit még a kiejtés is. Aki viszont elkülönült nyelvtani modulokban gondolkozik, nehezen definiálja a hogy elhagyhatóságát.
Hogy micsodák is a fogalmak, arról annyi sokat és különfélét mondtak már évezredek óta, hogy ezek után bátran állíthatjuk: fogalmunk sincs róluk.
Miért butaság, hogy az ige „cselekvést, történést vagy létezést jelentő szó”? Hogyan segítenek a nyelvészeknek a kétszavas mondatok? Kálmán László, az MTA nyelvésze nem adja fel, tovább csoportosít.
A jelentés fogalmát nem célszerű a megértés sokféle menetéhez és mibenlétéhez kötni. Ezek szerint tehát valami máshoz kellene lehorgonyozni? Vagy hagyjuk meg ilyen lazának? Vagy mondjunk le róla teljesen?
Nagy bajban vagyunk: a magyar jog nagyon alapvető kérdésekben, a szövegek értelmezésében olyan fogalmakra épül, amiknek a leírását jól ellenőrizhető, tételes formában sehol sem találjuk meg.
Hogyan lehet megállapítani, hogy melyik szófajba tartozik egy-egy szó? Minél többet tudsz a nyelvészetről, annál nehezebb.
Többet ártanak a magyar nyelvnek és használóinak a szélsőséges nyelvideológiák, mint egy nem kedvelt rokonság vagy a 21. századi infokommunikációs forradalom, derül ki A magyar nyelv jelene és jövője című, most megjelent tanulmánykötetből.
A legtöbb nyelvész alábecsüli annak a jelentőségét, hogy mennyire eltérően viselkednek az egyes szavak, szócsoportok. Ha valóban aszerint osztályoznánk őket, hogy milyen környezetekben fordulnak elő, kis túlzással minden szó külön szófajt alkotna.
Már harmadik elemiben elvont nyelvtani kategóriákkal bombázzák a gyerekeket, amiknek szinte semmilyen szemléleti alapjuk nincs. Hagyjuk a mára teljesen elavult iskolai nyelvtant!
Vigyázat, a „shoot a buck” nem biztos, hogy jó megoldás! Kálmán László, az MTA nyelvésze kollokációról, idiómákról, entrópiáról és gépi fordításról.
Hogyan mérhetjük meg a nyelvészetben, hogy mekkora az ára a rendetlenségnek? Vagy ami ugyanaz: a rendrakásnak? Mennyi információt hordoz a szóköz, és hány biten lehet eltárolni egy teknős útját?
A napokban újra fellángolt a vita arról, hogy vajon miért fordítja a Google Translate hímneműnek az orvost és nőneműnek az ápolót. De ha ez szexizmus, akkor miért következetesen nőnemű a kutya, és miért hímnemű a hegedűs?