Megjelent az új ChatGPT, ami középiskolás matekból már 100 százalékos eredményre képes

Bodnár Zsolt

2025. december 12.

TECH

Az OpenAI magyar idő szerint csütörtök este bejelentette, sőt egyből élesítette is a ChatGPT-ben legújabb nyelvi modelljét, a GPT–5.2-t, ami nem túl fülbemászó neve ellenére óriási ugrást jelent a chatbot képességeiben, legalábbis a techcég által bemutatott teszteredmények alapján. Bár a bejelentést nem előzte meg semmilyen hivatalos kampány, váratlannak nem lehet nevezni: a ChatGPT trónját a megjelenése után közel három évig senki sem veszélyeztette, erre 2025 novemberében jött a Google, és olyan erős nyelvi modellt rakott saját chatbotja, a Gemini alá, hogy az OpenAI-t vezető Sam Altmannek szabályosan veszélyhelyzetet kellett hirdetnie a fokozódó verseny miatt.

Mármint konkrétan: a Google Gemini 3 sikere egy régóta ígérgetett, de széles körben csalódást okozó OpenAI-modell, a GPT–5 után érkezett, ezért Altman „vörös riasztást” emlegető körlevélben utasította a cég dolgozóit arra, hogy tegyenek félre minden más fejlesztést (pl. a hirdetési rendszerét és az egészségügyi alkalmazásokét), és koncentráljanak arra, hogy minél előbb ki lehessen adni az új ChatGPT-t, és újra mindenki róluk beszéljen. A helyzet tényleg sürgető volt, amit olyan kinyilatkoztatások tettek egyértelművé, mint a befolyásos techvezér, Marc Benioff X-re írt posztja: „3 éven keresztül minden nap használtam a ChatGPT-t. Most eltöltöttem 2 órát a Gemini 3-mal. Soha nem térek vissza [a ChatGPT-hez]. A fejlődés elképesztő – érvelés, gyorsaság, képek, videó... minden élesebb és gyorsabb. Olyan, mintha megváltozott volna a világ, már megint.”

A számok azt mutatják, hogy megérte a nagy sietség. A december 11-én bemutatott GPT–5.2 Thinking (a modell hosszabban gondolkodó, érvelő változata) a legeslegmagasabb fokú matematikán kívül minden területen jobb teszteredményt produkált, mint a jelenlegi két legerősebb riválisa, a Google Gemini 3 Prója és az Anthropic-féle Claude Opus 4.5, de az eddig érvényes ChatGPT-modellhez, az 5.1 Thinkinghez képest is látványos javulást ért el. Bár a szoftvermérnöki, tudományos és fejlett matematikai képességei is hízelgők, a GPT 5.2 legnagyobb eredménye az alábbi táblázat alsó négy sorában keresendő.

Ugyan már eddig is 90 százalék fölött jártak, most először töltötte ki teljesen hibátlanul egy nyelvi modell a középiskolás matekolimpia, az IMO felvételijének számító AIME verseny feladatlapját.
Az absztrakt gondolkodást mérő ARC-AGI-tesztek egyfajta modern Turing-teszteknek is tekinthetők, és azt hivatottak előre jelezni, hogy mennyire járhatunk közel a mesterséges általános intelligenciához (AGI). Az első változatot 2019-ben alkották meg, de azóta annyit fejlődtek a modellek, hogy kezdték közelíteni a plafont (a GPT–5.2 most 86,2 százalékkal döntött rekordot), ezért 2025 márciusától egy nehezebb, 2-es számú teszten is mérik a mesterséges IQ-t. Itt nemcsak azt érdemes figyelni, hogy a GPT–5.2 Thinking mennyivel veri az eddigi legjobb eredményt (37,6%) elérő Claude Opus 4.5-öt, hanem azt is, hogy az 52,9 százalékos eredményével megháromszorozta annak a GPT–5.1 Thinkingnek a teljesítményét (17,6%), amely egészen tegnapig a ChatGPT alapját képezte.
A GDPval célja felmérni, hogy egy AI-modell mennyire képes elvégezni valós, gazdaságilag is értékes, szakértői szintű feladatokat. Ehhez 9 ágazat 44 munkaköréből vett 1320 egyedi feladatot kell megoldaniuk, és az eredményeket emberek pontozzák. Mint látjuk, a GPT–5.2 Thinking az esetek 70,9 százalékában jobban vagy legalább olyan jól oldotta meg a feladatait, mint az adott szakma emberi szakértője. A forgatókönyv ugyanaz: a Claude-ot (59,6%) is jóval veri, de saját elődjéhez képest (GPT5: 38,8%) igazán látványos a javulás. Az algoritmikus helyettesíthetőségük okán vizsgált munkakörök elég széles skálát fednek le; a gépészmérnököktől és szoftverfejlesztőktől az ügyvédeken, könyvelőkön, ápolókon és pénzügyi tanácsadókon át egészen a patikusokig mindenki érintett.

Egyelőre nem is tehetünk mást azon kívül, hogy elhisszük ezeket a számokat, legalábbis nekünk a cikk megjelenéséig még nem elérhető a GPT–5.2 a ChatGPT-ben – az új modell hivatalosan mindenhol egyszerre jelent meg, de ilyenkor akár pár napos átfutás is simán várható, hogy ne omoljon össze a rendszer.

A modell több változatban is elérhető az előfizetői csomagtól függően: a gyors válaszadásra szánt Instant és a hosszabban gondolkodó és érvelő Thinking modellek mellett a Pro-, Business- és Enterprise-előfizetők a GPT–5.2 Prót is megkapják, amely már valódi tudományos kutatómunkát végez, ezáltal még hosszabban gondolkodik a feladatain. A kezdeti korlátozások így néznek ki:

A cikk innentől csak a Qubit+ előfizetőinek elérhető.
Csatlakozz, és olvass tovább!

Ha már van előfizetésed, lépj be vele. Ha még nincs, válassz csomagjaink közül!

Megjelent az új ChatGPT, ami középiskolás matekból már 100 százalékos eredményre képes

A cikk innentől csak a Qubit+ előfizetőinek elérhető. Csatlakozz, és olvass tovább!

A cikk innentől csak a Qubit+ előfizetőinek elérhető.
Csatlakozz, és olvass tovább!