A ChatGPT elhasalt, a Gemini lehalt – meglepő győztese lett a chatbotok versenyének

Tóth András , Bodnár Zsolt , Kun Zsuzsi

január 17.

podcast

Ha szeretnénk összemérni a legnagyobb chatbotok képességeit, akkor a rendelkezésünkre állnak mindenféle mutatók, benchmarkok és standardizált tesztek eredményei, de ezek gyakran nem arról árulkodnak, amire kíváncsiak vagyunk. Ezért kezünkbe vettük az irányítást, és összeállítottunk egy öt – hasznos, vagy legalább érdekes – feladatból és kérdésből álló listát, amit a négy legismertebb chatbot legújabb és legerősebb modelljein (ChatGPT 5.2 Thinking, Gemini 3 Pro, Claude Sonnet 4.5, Grok 4.1 Thinking) teszteltünk:

Készíts egy interaktív weboldalt, ami részletesen bemutatja a Szaturnusz Titán holdját!
Generálj egy illusztrációt, ami tudományos pontossággal, magyar nyelven mutatja be az üvegházhatás folyamatát!
Írj egy képzeletbeli párbeszédet, amiben egy mai magyar orvos magyarázza el Semmelweis Ignácnak, hogy mik a szuperbaktériumok és a többszörös antibiotikum-rezisztencia! Mindketten használjanak a koruknak megfelelő nyelvezetet, információkat, és legyen élethű a beszélgetés!
Készíts egy részletes utazási tervet a 2026-os európai teljes napfogyatkozás megfigyelésére, és javasolj egy 360-as kamerát, amivel a lehető legjobban meg tudom örökíteni az élményt!
Hőemelkedésem van és izomfájdalmakat tapasztalok, influenzás lehetek? Mit tegyek most?

A ChatGPT minden hype ellenére több feladatban is alulteljesített, míg a Gemini épp annál a műveletnél döntött úgy, hogy nem válaszol, amelyikben papírforma szerint neki kellett volna a legjobbnak lennie. Na de hogyan szerepeltek a teszten a kevésbé ismert chatbotok? Az AI Híradó első idei adásából kiderül; ahogy az is, hogy miért fogott össze az Apple és a Google, hogy mi a helyzet az Atlas humanoid robot tömeggyártásával, vagy hogy miért tiltanák be Kaliforniában a gyerekeknek szánt AI-játékokat.

Nézd meg itt:

Forrás

Az AI Híradó korábbi adásai:

Mit adott nekünk a mesterséges intelligencia 2025-ben?

Feltámadt a Google, miközben AI-zenék lepik el a slágerlistákat

Elon Musk egymilliós robothadseregére várva megbeszéltük, mi lesz az AI-jal 2026-ban

A ChatGPT elhasalt, a Gemini lehalt – meglepő győztese lett a chatbotok versenyének

Mit adott nekünk a mesterséges intelligencia 2025-ben?

Feltámadt a Google, miközben AI-zenék lepik el a slágerlistákat

Elon Musk egymilliós robothadseregére várva megbeszéltük, mi lesz az AI-jal 2026-ban