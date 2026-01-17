Ha szeretnénk összemérni a legnagyobb chatbotok képességeit, akkor a rendelkezésünkre állnak mindenféle mutatók, benchmarkok és standardizált tesztek eredményei, de ezek gyakran nem arról árulkodnak, amire kíváncsiak vagyunk. Ezért kezünkbe vettük az irányítást, és összeállítottunk egy öt – hasznos, vagy legalább érdekes – feladatból és kérdésből álló listát, amit a négy legismertebb chatbot legújabb és legerősebb modelljein (ChatGPT 5.2 Thinking, Gemini 3 Pro, Claude Sonnet 4.5, Grok 4.1 Thinking) teszteltünk:

Készíts egy interaktív weboldalt, ami részletesen bemutatja a Szaturnusz Titán holdját!

Generálj egy illusztrációt, ami tudományos pontossággal, magyar nyelven mutatja be az üvegházhatás folyamatát!

Írj egy képzeletbeli párbeszédet, amiben egy mai magyar orvos magyarázza el Semmelweis Ignácnak, hogy mik a szuperbaktériumok és a többszörös antibiotikum-rezisztencia! Mindketten használjanak a koruknak megfelelő nyelvezetet, információkat, és legyen élethű a beszélgetés!

Készíts egy részletes utazási tervet a 2026-os európai teljes napfogyatkozás megfigyelésére, és javasolj egy 360-as kamerát, amivel a lehető legjobban meg tudom örökíteni az élményt!

Hőemelkedésem van és izomfájdalmakat tapasztalok, influenzás lehetek? Mit tegyek most?

A ChatGPT minden hype ellenére több feladatban is alulteljesített, míg a Gemini épp annál a műveletnél döntött úgy, hogy nem válaszol, amelyikben papírforma szerint neki kellett volna a legjobbnak lennie. Na de hogyan szerepeltek a teszten a kevésbé ismert chatbotok? Az AI Híradó első idei adásából kiderül; ahogy az is, hogy miért fogott össze az Apple és a Google, hogy mi a helyzet az Atlas humanoid robot tömeggyártásával, vagy hogy miért tiltanák be Kaliforniában a gyerekeknek szánt AI-játékokat.

