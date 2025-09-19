A DeepSeek AI nevű kínai mesterségesintelligencia-cég kifejlesztett egy olyan modellt, amely képes önállóan megtanulni a problémamegoldó gondolkodást anélkül, hogy lépésről lépésre emberi iránymutatást kapna – derül ki a Nature folyóiratban a héten megjelent tanulmányból.

Az R1 nevű, úgynevezett érvelő modell legújabb változatát megerősítéses tanulással képezték ki, vagyis olyan próbálkozáson alapuló (trial-and-error, vagyis próba–hiba) módszerrel, amely a helyes válaszokat jutalmazza ahelyett, hogy megmutatná a megoldás minden lépését. A matematikai, kódolási és tudományos feladatokon való képzés során az R1 megtanulta ellenőrizni saját munkáját, különböző stratégiákat kipróbálni, sőt „megállni” és átgondolni a választ, mielőtt kimondja azt. Az emberi beavatkozás minimális volt, és főleg a képességek finomhangolására korlátozódott, így csökkentve annak kockázatát, hogy az emberi torzítások befolyásolják a modell gondolkodását.

Az eredmények lenyűgözőek: az R1 felülmúlta a hagyományos, emberi iránymutatással képzett modelleket több feladattípusban, és 86,7 százalékos eredményt ért el a 2024-es American Invitational Mathematics Examination versenyen, amely az egyik legnehezebb matematikai megmérettetés a legtehetségesebb középiskolások számára.

A kutatók ugyanakkor óvatosságra intenek, mivel a modellnek még vannak hiányosságai – például néha keveri a nyelveket, míg a túl egyszerű problémákat feleslegesen bonyolítja. A fejlesztők szerint ezek a hibák kijavíthatók, és az önálló gondolkodásra képes mesterséges intelligencia új korszakot nyithat, amelyben a rendszerek autonómabbak, képességeikben fejlettebbek és kevésbé torzultak lesznek.