Itt az okoskarkötő, ami már a hangodból megmondja, hogy mérges vagy
A digitális személyre szabás új kapuit döngetik a nagy techcégek: már nem csupán a test mérhető fizikai jeleit igyekeznek megmutatni a felhasználóknak lépésszámlálók, pulzus-, EKG- és szívritmusmérők vagy véroxigénszint-jelzők fitnesskarkötőkké gyúrásával, hanem az érzelmeiket is. Az Amazon nemrég mutatta be új, csuklón viselhető eszközét, a Halo-t, amely azon túl, hogy felvonultatja az egészséges életmódot hirdető kütyük kötelező elemeit (aktivitás-, lépésszám- és alvásmérés), fényképes 3D-modellalkotó technológiája segítségével teljes képet rajzol felhasználója testéről, és okos algoritmusa segítségével kiszámolja annak testzsírszázalékát. És az újdonság: hangelemző rendszerével igyekszik belőni tulajdonosának aktuális érzelmi állapotát.
Az utóbbi időben érzékelhető trendek szerint az érzelmek és a személyiségjegyek mesterséges intelligencia-alapú monitorozása egyre nagyobb befektetéseket vonz – még akkor is, ha tudományos megalapozottságuk és eredményességük egyelőre legalábbis megkérdőjelezhető. A Gartner nemzetközi technológiai elemző cég előrejelzései szerint 2022-ig a személyi eszközök 10 százalékában már lesz beépített érzelemfelismerő AI, míg ez az arány 2018-ban még csak 1 százalékot tett ki.
Mind hangemberek vagyunk
Az elmúlt évek során hatalmas fejlődésen mentek át a szűk mesterséges intelligencia (narrow AI - ANI) elérését célzó algoritmusok: egyre több a kép- és hangfelismerő algoritmus vagy a szövegelemző (természetesnyelv-feldolgozó) program. A kutatások egyik iránya pedig kifejezetten azt célozza, hogy az emberi test jelzései alapján – mimika, arckifejezés, testtartás, hangszín, intonáció, a beszéd ritmusa, tempója vagy a kimondott szavak – megállapítsa, milyen hangulatban van a vizsgált emberi lény.
Az emberi beszédet folyamatosan figyelő virtuális asszisztensek fejlődésével, mint az Amazon Alexája, az Apple Sirije, az OK, Google hangalapú keresés vagy éppen az automatikus diktáló programok egyre több adat áll rendelkezésre az efféle hangelemzéshez. Ezekből pedig egy sor mentális betegség jeleire, krónikus és gyógyíthatatlan betegségek korai tüneteire vagy éppen adott érzelmi állapotokra lehet következtetni, ez utóbbiból pedig számos technológia a várható viselkedést is igyekszik előre jelezni.
Mentális betegségek hangalapú diagnosztikája
A hangmintázatokat már évtizedek óta vizsgálják a kutatók, és régóta tudható, hogy a mentális rendellenességek indikátorai: 1921-ben Emil Kraepelin állapította meg, hogy a depressziós betegek hangja alacsonyabb hangfekvésű, monotonabb, halkabb, kevesebbet beszélnek, esetleg suttognak vagy dadognak.
Az algoritmusok fejlődésével arra is lehetőség nyílik, hogy egyre nagyobb adathalmazokat felhasználva egyre pontosabb hangalapú biomarkereket társítsanak az egyes betegségekhez. Charles Marmar, a New York-i Egyetem Langone Egészségügyi Központja pszichiátriai osztályának vezetője például egy ötéves kutatás keretében a poszttraumás stressz szindrómával (PTSD) összefüggésbe hozható, mintegy harminc hangalapú biomarkert azonosított veteránok és a felmérésben részt vevő más alanyok hangmintáiból. Ezek alapján kifejlesztettek egy gépi tanulással fejlődő programot a PTSD diagnosztizálására. Egy másik kutatásban egy hasonló analitikával működő algoritmus gyerekeknél állapított meg depressziót és szorongásos tüneteket hangminták alapján.
A koronavírus is hallatszódhat a hangodon
Az algoritmusok nem csupán a mentális állapotra képesek következtetni egy elnyújtott reggeli köszönésből. Az amerikai Mayo Clinic az izraeli Beyond Verbal mesterséges intelligencia-alapú hangelemzésre specializálódott céggel közösen olyan vizsgálatot indított, amelyben a koszorúér-betegségben szenvedők hangját elemzik. Azt igyekeznek feltárni, hogy az érelmeszesedés miatti mellkasi fájdalom hatással lehet-e a hangképzésre. A 150 beteg részvételével zajló kutatásban már 13 olyan hangalapú biomarkert találtak, amelyek összefüggésbe hozhatók a koszorúér-betegséggel. A cél az, hogy az eredmények alapján olyan, okostelefonra letölthető applikációt fejlesszenek, amely hangminta alapján képes diagnosztizálni a kórt.
A járványhelyzetben nem meglepő, hogy a koronavírus kimutatására is igyekeznek hangelemző alkalmazást létrehozni. A pittsburghi Carnegie Mellon Egyetem tudósaiból és mérnökeiből álló kutatócsoport idén májusban már elérhetővé tett egy alkalmazást, hogy lehetőleg minél több embertől hangmintát gyűjthessen a COVID-19 jövőbeli sikeres kimutatásához. Egy ilyen program a kutatók szerint a vértesztnél pontosabban és a jelenleg elérhető teszteknél olcsóbban mutathatná ki a vírus jelenlétét.
Az AI rászól az ügyintézőre, ha nem elég empatikus
Ha már a depressziót, poszttraumás stresszt vagy egyenesen szívbetegségeket is képes hangminta alapján kimutatni a mesterséges intelligencia, egyszerűnek és természetesnek tűnik a stressz, a düh vagy a letörtség észlelése, amit drága jó anyánk már a telefonba morgott köszönésből észrevesz. A hangalapú AI-t fejlesztő cégek szerint viszont ehhez nem kell szülői intuíció: a nagy adathalmazokból leszűrhető információk alapján az algoritmusok néhány másodperc alatt bárki hangulatát megállapíthatják, és ez számos ügyfélkapcsolatokra építő ágazatban kulcsfontosságú lehet.
Az amerikai Cogito például valós időben elemez telefonbeszélgetéseket, és szolgáltatásait már több üzletágban használják: a szolgáltatási szektorban az eladások növelésére vagy az egészségügyben a páciensekkel való kommunikációra. Az algoritmus például tippeket ad a biztosítási ügyeket intéző ügyfélszolgálaton dolgozóknak, hogyan bánhatnak empatikusabban a telefonálókkal. Figyelmezteti őket, ha a hangjukon stressz, düh vagy nyugtalanság hallatszódik, vagy ha beszélgetőpartnerüknek empatikusabb tónusra lenne szüksége.
Az Amazon által nemrég piacra dobott Halo Tone-nak nevezett szolgáltatása nagyon hasonlít a Cogito módszereire, csak a felhasználó más. A karkötőbe épített két mikrofon felveszi viselője hangját, az algoritmus pedig megállapítja, hogy az illető éppen boldognak, szomorúnak, izgatottnak vagy fáradtnak tűnik-e. A techcég szerint ezzel a karkötő viselői visszajelzést kaphatnak mentális állapotukról, ami segíthet nekik harmonikusabb kapcsolatokat fenntartani embertársaikkal. Természetesen azonnal felmerül a kérdés, mennyire szeretnénk, hogy egy karkötő nyilatkozzon az érzelmeinkről és adjon visszajelzést valamilyen, az Amazon algoritmusai alapján felállított, univerzálisnak egyáltalán nem tekinthető mérce alapján.
Mi a gond a gépi EQ-val?
Azon kívül, hogy riasztónak tűnik a lehetőség, hogy a komplex emberi érzelmeket egy karkötő algoritmusa fordítsa le fogyaszthatóvá, számos más probléma is felmerül. Egyrészt mit kezd a felhasználó ezzel az információval? És mit kezd vele az Amazon? Ahogy az Apple Watch mozgásra buzdít, ha már túl sokat ült az asztalánál az egyszeri irodista, a Halo majd Amazon Prime tévésorozatokat vagy zenéket ajánl, ha túl szomorúnak találja az embert? Nem lesz attól valaki még depressziósabb, ha a fitnesskarkötője akarja felvidítani?
Semmivel sem szimpatikusabb az a lehetőség sem, hogy az Amazon Halója felveszi a beszélgetéseket a hangelemzéshez, és Bluetoothon keresztül a hozzá kapcsolt telefonra küldi elemzésre – igaz, a cég hangsúlyozza, hogy magát a szolgáltatást kifejezett hozzájárulással (opt-in) lehet igénybe venni, a mikrofon bármikor kikapcsolható, a hangmintákat semmilyen szerverre nem töltik fel, és senki nem hallgatja meg őket. Sőt, az Amazon azt állítja, hogy a Halo alkalmazás az elemzést követően azonnal törli is a hangmintákat.
A CNBC riportja szerint a cég azt is megígérte, hogy hirdetési célokra sem fogja használni a begyűjtött adatokat. De ha maga az Amazon nem is, mások partnerség keretében már használják is megfigyelésre: az egyik legrégebbi és legnagyobb amerikai életbiztosító társaság, a John Hancock például azt ajánlja ügyfeleinek, hogy három évre ingyen megkapják a fitnesskarkötőt és szolgáltatásait, ha cserébe átadják az adataikat. A biztosító ezek alapján döntheti el, kinek hogyan változik a biztosítási díja, és különleges ajánlatokkal jutalmazza az adatszolgáltatókat.
Gépi előítéletek és amerikai angol
Ha mindez nem lenne eléggé ijesztő, még mindig ott vannak az efféle rendszerek esetén az utóbbi időben sorozatosan feltárt „gépi előítéletek”. Az érzelmek szubjektív természetét tekintve pedig az ilyen előítélet még hangsúlyosabb lehet, mint egyéb esetekben. Egy néhány évvel ezelőtt publikált tanulmány például arra a következtetésre jutott, hogy az érzelmeket elemző technológia bizonyos etnikai csoportok tagjainak több negatív érzelmet tulajdonít, mint másoknak. Ennek komoly következményei lehetnek például egy olyan munkahelyen, ahol efféle algoritmus értékeli a munkatársakat, és az előléptetéshez a megfelelő mértékű lelkesedés is számít.
Az algoritmusok egyelőre még biztosan nem elég kifinomultak ahhoz, hogy az érzelemkifejezés kulturális különbségeit arcról vagy akár hangról pontosan leolvassák. Egyelőre az Amazon is híján van az algoritmusa működőképességét alátámasztó peer-reviewed tanulmányoknak, és a hangelemző szoftvert is kizárólag amerikai angol akcentuson tesztelték, vagyis a magyar felhasználóknak még jócskán várniuk kellene arra, hogy a fitnesskarkötőjük mondja meg nekik, elég boldogan ébredtek-e aznap reggel.
Kapcsolódó cikkek a Qubiten: