Megjelent az új ChatGPT, ami középiskolás matekból már 100 százalékos eredményre képes

2025. december 12.
TECH
  • Link másolása
  • Facebook
  • X (Twitter)
  • Tumblr
  • LinkedIn

Ajándékozás

A cikkek megosztásához Qubit+ tagságra van szükséged.

Ha már előfizetőnk vagy, jelentkezz be! Ha még nem, válassz a csomagjaink közül!

Az OpenAI magyar idő szerint csütörtök este bejelentette, sőt egyből élesítette is a ChatGPT-ben legújabb nyelvi modelljét, a GPT–5.2-t, ami nem túl fülbemászó neve ellenére óriási ugrást jelent a chatbot képességeiben, legalábbis a techcég által bemutatott teszteredmények alapján. Bár a bejelentést nem előzte meg semmilyen hivatalos kampány, váratlannak nem lehet nevezni: a ChatGPT trónját a megjelenése után közel három évig senki sem veszélyeztette, erre 2025 novemberében jött a Google, és olyan erős nyelvi modellt rakott saját chatbotja, a Gemini alá, hogy az OpenAI-t vezető Sam Altmannek szabályosan veszélyhelyzetet kellett hirdetnie a fokozódó verseny miatt.

Mármint konkrétan: a Google Gemini 3 sikere egy régóta ígérgetett, de széles körben csalódást okozó OpenAI-modell, a GPT–5 után érkezett, ezért Altman „vörös riasztást” emlegető körlevélben utasította a cég dolgozóit arra, hogy tegyenek félre minden más fejlesztést (pl. a hirdetési rendszerét és az egészségügyi alkalmazásokét), és koncentráljanak arra, hogy minél előbb ki lehessen adni az új ChatGPT-t, és újra mindenki róluk beszéljen. A helyzet tényleg sürgető volt, amit olyan kinyilatkoztatások tettek egyértelművé, mint a befolyásos techvezér, Marc Benioff X-re írt posztja: „3 éven keresztül minden nap használtam a ChatGPT-t. Most eltöltöttem 2 órát a Gemini 3-mal. Soha nem térek vissza [a ChatGPT-hez]. A fejlődés elképesztő – érvelés, gyorsaság, képek, videó... minden élesebb és gyorsabb. Olyan, mintha megváltozott volna a világ, már megint.”

A számok azt mutatják, hogy megérte a nagy sietség. A december 11-én bemutatott GPT–5.2 Thinking (a modell hosszabban gondolkodó, érvelő változata) a legeslegmagasabb fokú matematikán kívül minden területen jobb teszteredményt produkált, mint a jelenlegi két legerősebb riválisa, a Google Gemini 3 Prója és az Anthropic-féle Claude Opus 4.5, de az eddig érvényes ChatGPT-modellhez, az 5.1 Thinkinghez képest is látványos javulást ért el. Bár a szoftvermérnöki, tudományos és fejlett matematikai képességei is hízelgők, a GPT 5.2 legnagyobb eredménye az alábbi táblázat alsó négy sorában keresendő.

  • Ugyan már eddig is 90 százalék fölött jártak, most először töltötte ki teljesen hibátlanul egy nyelvi modell a középiskolás matekolimpia, az IMO felvételijének számító AIME verseny feladatlapját.
  • Az absztrakt gondolkodást mérő ARC-AGI-tesztek egyfajta modern Turing-teszteknek is tekinthetők, és azt hivatottak előre jelezni, hogy mennyire járhatunk közel a mesterséges általános intelligenciához (AGI). Az első változatot 2019-ben alkották meg, de azóta annyit fejlődtek a modellek, hogy kezdték közelíteni a plafont (a GPT–5.2 most 86,2 százalékkal döntött rekordot), ezért 2025 márciusától egy nehezebb, 2-es számú teszten is mérik a mesterséges IQ-t. Itt nemcsak azt érdemes figyelni, hogy a GPT–5.2 Thinking mennyivel veri az eddigi legjobb eredményt (37,6%) elérő Claude Opus 4.5-öt, hanem azt is, hogy az 52,9 százalékos eredményével megháromszorozta annak a GPT–5.1 Thinkingnek a teljesítményét (17,6%), amely egészen tegnapig a ChatGPT alapját képezte.
  • A GDPval célja felmérni, hogy egy AI-modell mennyire képes elvégezni valós, gazdaságilag is értékes, szakértői szintű feladatokat. Ehhez 9 ágazat 44 munkaköréből vett 1320 egyedi feladatot kell megoldaniuk, és az eredményeket emberek pontozzák. Mint látjuk, a GPT–5.2 Thinking az esetek 70,9 százalékában jobban vagy legalább olyan jól oldotta meg a feladatait, mint az adott szakma emberi szakértője. A forgatókönyv ugyanaz: a Claude-ot (59,6%) is jóval veri, de saját elődjéhez képest (GPT5: 38,8%) igazán látványos a javulás. Az algoritmikus helyettesíthetőségük okán vizsgált munkakörök elég széles skálát fednek le; a gépészmérnököktől és szoftverfejlesztőktől az ügyvédeken, könyvelőkön, ápolókon és pénzügyi tanácsadókon át egészen a patikusokig mindenki érintett.

Egyelőre nem is tehetünk mást azon kívül, hogy elhisszük ezeket a számokat, legalábbis nekünk a cikk megjelenéséig még nem elérhető a GPT–5.2 a ChatGPT-ben – az új modell hivatalosan mindenhol egyszerre jelent meg, de ilyenkor akár pár napos átfutás is simán várható, hogy ne omoljon össze a rendszer.

A modell több változatban is elérhető az előfizetői csomagtól függően: a gyors válaszadásra szánt Instant és a hosszabban gondolkodó és érvelő Thinking modellek mellett a Pro-, Business- és Enterprise-előfizetők a GPT–5.2 Prót is megkapják, amely már valódi tudományos kutatómunkát végez, ezáltal még hosszabban gondolkodik a feladatain. A kezdeti korlátozások így néznek ki:

A cikk innentől csak a Qubit+ előfizetőinek elérhető.
Csatlakozz, és olvass tovább!

Ha már van előfizetésed, lépj be vele. Ha még nincs, válassz csomagjaink közül!