A mesterséges intelligencia megjósolja, hogy megosztasz-e egy álhírt a közösségi médiában
Egy új mesterségesintelligencia-alapú algoritmus nagy pontossággal modellezi, hogy a Twitter-felhasználók mikor fognak megtévesztő információkat terjeszteni, méghozzá jóval azelőtt, hogy megtennék – írja a Techxplore hírportál.
Az algoritmust a Sheffieldi Egyetem kutatói fejlesztették; a témával foglalkozó kutatást Yida Mu és dr. Nikos Aletras, az egyetem számítástudományi tanszékének munkatársai vezették. Mu és Aletras kifejlesztettek egy módszert, amivel előrejelezhető, hogy a közösségimédia-felhasználók mekkora valószínűséggel fognak megbízhatatlan vagy ellenőrizetlen forrásból származó tartalmakat megosztani.
A kutatásban nagyjából 6200 Twitter-felhasználó több mint egymillió, nyilvánosan hozzáférhető és megosztható posztját elemezték. Ehhez természetes nyelvfeldolgozó (natural language processing, NLP) eszközöket használtak, amik rengeteg nyelvi adatot tudnak feldolgozni és értelmezni.
Egy bolond százat csinál, száz meg tízezret
Közismert, hogy a közösségi médiában szerkesztői kontroll nélküli milyen gyorsan terjedhet a dezinformáció. Koholt vádak, megtévesztő címadás, propaganda, áltudomány – minden játszik. A félrevezető tartalmak jellemzően akkor kezdenek terjedni, ha egy hírforrás közzétesz egy történetet, amit a felhasználók megosztanak, a követőik pedig újraposztolnak (retweet).
A PeerJ Computer Science folyóiratban megjelent tanulmány szerzői már korábban megfigyelték, hogy a közösségi médiában a dezinformáció gyorsabban terjed a tényeknél. Azt is tudjuk, hogy ha a felhasználók többször is látnak egy félrevezető linket, kevésbé fogják megkérdőjelezni a hitelességét.
Egy bolond százat csinál, és a közösségi média gyorsaságának köszönhetően a százakból hamar tízezrek lesznek. A megbízhatatlan tartalmat terjesztő források – írják a tanulmány szerzői – gyakran az emberek véleményét vagy választások eredményét akarják befolyásolni, és ez világszerte kihat a politikai stabilitásra.
A kutatók szerint a megbízhatatlan értesüléseket megosztók korai felismerése több szempontból is hasznos lehet:
- segíthet a politológusoknak és az újságíróknak, hogy megállapíthassák, hogy milyen témákban a legmagasabb a dezinformáció-megosztási hajlandóság
- a korai előrejelzés segítségével a közösségimédia-platformok megelőzhetnék a potenciálisan megbízhatatlan tartalmak terjedését a hálózaton;
- a pszichológusok értékes nyersanyaghoz juthatnának, amit személyiségelemzési tanulmányokhoz használhatnának fel.
A tanulmány szerzői azt vizsgálták, hogy a nyelvi információk elemzésével megállapítható-e, hogy ki fog megbízhatatlan forrásból származó híreket megosztani a Twitteren. A hipotézis teszteléséhez osztályozási rendszert hoztak létre, hogy megjósolják, milyen valószínűséggel fog egy-egy felhasználó megbízhatatlan tartalmakat megosztani.
Szülinap vagy liberális média?
A kutatók két kategóriára bontották a vizsgált felhasználókat, aszerint, hogy mennyire voltak hajlamosak megbízhatatlan forrásból származó tartalmak megosztására, majd az adatokat egy gépi tanulásra képes algoritmus betanításához használták fel. Több ilyen algoritmus is létezik; ezek betanításához általában címkézett adatokat használnak. A Twitter esetében a tanulmány szerzőinek könnyű dolguk volt, mert az adatok címkézését részben ők maguk végezték el, részben viszont a Twitter, ahol a címkék használata szerves része a szolgáltatásnak.
A használt algoritmus 79,7 százalékos pontossággal jósolta meg, hogy a felhasználók meg fogják-e osztani az ellenőrizetlen tartalmakat. A kutatás ezenfelül is érdekes eredményeket hozott.
- A megbízhatatlan forrásból származó adatokat leginkább azok a felhasználók terjesztették, akik szívesen osztottak meg politikai vagy vallási témájú tartalmakat. Ők az udvariatlan kifejezésmódra is hajlamosabbak voltak. A posztjaikban gyakoriak voltak az olyan szavak, mint a liberális (liberal), kormány (government), média (media). Gyakran hozták szóba a Közel-Kelet politikáját, és a tweetjeikben visszatérő kifejezés volt az iszlám (Islam) vagy Izrael (Israel).
- A megbízható forrásokat előnyben részesítő felhasználók leginkább a saját életükről szóló posztokat osztottak meg. Gyakran írtak magukról, az érzelmeikről, a barátaikról, és a bejegyzéseikben gyakoriak voltak az olyan kifejezések, mint a hangulat (mood), az akarom (wanna), a fogom (gonna), a fogom (I’ll), az izgatott (excited) és a születésnap (birthday).
„A közösségi média az emberek egyik kedvenc hírfogyasztási eszközévé vált. Több millió felhasználó használja naponta az olyan platformokat, mint a Facebook vagy a Twitter, hogy megismerje a környezetében és a világ minden táján zajló eseményeket. A közösségi média ugyanakkor a fő platformja a dezinformáció terjesztésének. Ennek nagy hatása van a társadalomra, és befolyásolhatja azt, ahogy az emberek megítélik maguk körül a világot.”
– mondta dr. Nikos Aletras. Yida Mu, aki a doktoriján dolgozik a Sheffieldi Egyetemen, úgy látja, épp ezért fontos tanulmányozni és elemezni a közösségi médiát, hogy megelőzhessük az álhírek terjedését a felhasználók körében. Az új eljárás hasznos, a posztok és hírforrások szintjén működő kiegészítése lehet a ma is használt tényellenőrző módszereknek.
Kapcsolódó cikkek Qubiten: