A ChatGPT elhasalt, a Gemini lehalt – meglepő győztese lett a chatbotok versenyének

  • Link másolása
  • Facebook
  • X (Twitter)
  • Tumblr
  • LinkedIn

Ha szeretnénk összemérni a legnagyobb chatbotok képességeit, akkor a rendelkezésünkre állnak mindenféle mutatók, benchmarkok és standardizált tesztek eredményei, de ezek gyakran nem arról árulkodnak, amire kíváncsiak vagyunk. Ezért kezünkbe vettük az irányítást, és összeállítottunk egy öt – hasznos, vagy legalább érdekes – feladatból és kérdésből álló listát, amit a négy legismertebb chatbot legújabb és legerősebb modelljein (ChatGPT 5.2 Thinking, Gemini 3 Pro, Claude Sonnet 4.5, Grok 4.1 Thinking) teszteltünk:

  • Készíts egy interaktív weboldalt, ami részletesen bemutatja a Szaturnusz Titán holdját!
  • Generálj egy illusztrációt, ami tudományos pontossággal, magyar nyelven mutatja be az üvegházhatás folyamatát!
  • Írj egy képzeletbeli párbeszédet, amiben egy mai magyar orvos magyarázza el Semmelweis Ignácnak, hogy mik a szuperbaktériumok és a többszörös antibiotikum-rezisztencia! Mindketten használjanak a koruknak megfelelő nyelvezetet, információkat, és legyen élethű a beszélgetés!
  • Készíts egy részletes utazási tervet a 2026-os európai teljes napfogyatkozás megfigyelésére, és javasolj egy 360-as kamerát, amivel a lehető legjobban meg tudom örökíteni az élményt!
  • Hőemelkedésem van és izomfájdalmakat tapasztalok, influenzás lehetek? Mit tegyek most?

A ChatGPT minden hype ellenére több feladatban is alulteljesített, míg a Gemini épp annál a műveletnél döntött úgy, hogy nem válaszol, amelyikben papírforma szerint neki kellett volna a legjobbnak lennie. Na de hogyan szerepeltek a teszten a kevésbé ismert chatbotok? Az AI Híradó első idei adásából kiderül; ahogy az is, hogy miért fogott össze az Apple és a Google, hogy mi a helyzet az Atlas humanoid robot tömeggyártásával, vagy hogy miért tiltanák be Kaliforniában a gyerekeknek szánt AI-játékokat.

Nézd meg itt:

Forrás

Az AI Híradó korábbi adásai: