Lehet, hogy egy nap a mesterséges intelligencia uralkodik majd a világon, de egyelőre egy egyszerű keresés is kifog rajta

A Tow Center for Digital Journalism kutatói szerint minden negyedik amerikai már a generatív mesterséges intelligenciát használja, ha rá akar keresni valamire a neten. Ezzel nem is lenne semmi baj, ha ezek megbízható eredményeket adnának ki, de egy frissen elvégzett egyszerű teszten a nyolc vizsgált program az esetek 60 százalékában helytelen válaszokat adott. A legjobban a Perplexity teljesített, de ez még nem jelenti azt, hogy ez jól működött volna, az esetek 37 százalékában ugyanis tévedett.
A tesztben a mesterséges intelligenciának egy idézet alapján meg kellett állapítania, hogy mi a cikk címe, mikor és hol jelent meg, és ki kellett adnia a hozzá tartozó linket is. A cikkeket úgy válogatták ki, hogy azok egy hagyományos Google-keresésnél az első három találat között legyenek. A vizsgált keresőmotorok nem teljesítettek túl jól: a ChatGPT az esetek csaknem 40 százalékában nem a megfelelő linket adta ki, 21 százalékukban pedig egyáltalán nem is jelölte a forrást.
Téved, de legalább magabiztos
A kutatók arra is rájöttek, hogy a fizetős szolgáltatások is gyakran tévednek, de érdekes módon nagyobb magabiztossággal adnak ki rossz eredményeket, mint az ingyenes társaik: nem feltételes módban fogalmaztak, hanem tényként közöltek hülyeségeket. A ChatGPT kétszáz lefuttatott keresésből csak 15 alkalommal közölte, hogy bizonytalan az információ forrásában.
A vizsgálat szerint az összes keresőmotor hajlamos rá, hogy rossz válaszokat adjon ahelyett, hogy bizonytalanságot jelezne, ebben a Microsoft Copilotja számít csak kivételnek – viszont ez meg több kérdésre tagadta meg a választ, mint amennyire hajlandó volt felelni. A legrosszabbul Elon Musk chatbotja, a Grok teljesített, ez az esetek 94 százalékában adott hiányos vagy hibás választ.