A ChatGPT elhasalt, a Gemini lehalt – meglepő győztese lett a chatbotok versenyének
- Link másolása
- X (Twitter)
- Tumblr
Ha szeretnénk összemérni a legnagyobb chatbotok képességeit, akkor a rendelkezésünkre állnak mindenféle mutatók, benchmarkok és standardizált tesztek eredményei, de ezek gyakran nem arról árulkodnak, amire kíváncsiak vagyunk. Ezért kezünkbe vettük az irányítást, és összeállítottunk egy öt – hasznos, vagy legalább érdekes – feladatból és kérdésből álló listát, amit a négy legismertebb chatbot legújabb és legerősebb modelljein (ChatGPT 5.2 Thinking, Gemini 3 Pro, Claude Sonnet 4.5, Grok 4.1 Thinking) teszteltünk:
- Készíts egy interaktív weboldalt, ami részletesen bemutatja a Szaturnusz Titán holdját!
- Generálj egy illusztrációt, ami tudományos pontossággal, magyar nyelven mutatja be az üvegházhatás folyamatát!
- Írj egy képzeletbeli párbeszédet, amiben egy mai magyar orvos magyarázza el Semmelweis Ignácnak, hogy mik a szuperbaktériumok és a többszörös antibiotikum-rezisztencia! Mindketten használjanak a koruknak megfelelő nyelvezetet, információkat, és legyen élethű a beszélgetés!
- Készíts egy részletes utazási tervet a 2026-os európai teljes napfogyatkozás megfigyelésére, és javasolj egy 360-as kamerát, amivel a lehető legjobban meg tudom örökíteni az élményt!
- Hőemelkedésem van és izomfájdalmakat tapasztalok, influenzás lehetek? Mit tegyek most?
A ChatGPT minden hype ellenére több feladatban is alulteljesített, míg a Gemini épp annál a műveletnél döntött úgy, hogy nem válaszol, amelyikben papírforma szerint neki kellett volna a legjobbnak lennie. Na de hogyan szerepeltek a teszten a kevésbé ismert chatbotok? Az AI Híradó első idei adásából kiderül; ahogy az is, hogy miért fogott össze az Apple és a Google, hogy mi a helyzet az Atlas humanoid robot tömeggyártásával, vagy hogy miért tiltanák be Kaliforniában a gyerekeknek szánt AI-játékokat.
Nézd meg itt:
Az AI Híradó korábbi adásai: