Doktorrá avatták a ChatGPT-t: ingyen elérhető az OpenAI várva várt új modellje, a GPT–5

Bodnár Zsolt

augusztus 8.

TECH

Link másolása
Facebook
X (Twitter)
Tumblr
LinkedIn

„A GPT–3 kicsit olyan volt, mintha egy középiskolás diákkal beszélgetnénk. A GPT–4 olyan volt, mintha egy egyetemistával beszélgetnénk. A GPT–5-nél érzem először azt, hogy tényleg olyan, mintha bármilyen témában egy PhD-szintű szakértővel beszélgetnénk” – ezekkel a szavakkal vezette fel Sam Altman, az OpenAI vezérigazgatója a ChatGPT motorjaként szolgáló nagy nyelvi modell (LLM), a GPT családjának legújabb, ötös számú tagját, amiről magyar idő szerint csütörtök este rántották le a leplet, és már elérhetővé is tették a ChatGPT-ben.

Az első beszámolók alapján azonban a GPT–5 nem az a forradalmi újdonság, amire sokan számítottak. Persze, a különböző mutatók (kódolás, szövegértés stb.) alapján is van valamennyi javulás az előző modellekhez képest – még ha a ChatGPT-vel készült (hallucináltatott) grafikonokon az 53 több is, mint a 69 –, de ez már nem az a szintugrás, mint amikor a GPT–3-nál rácsodálkoztunk, hogy önállóan ír szöveget a gép, a GPT–4 pedig hirtelen már képeket is tudott értelmezni. Hiába mondta tehát a bejelentést megelőző sajtótájékoztatón Altman, hogy az új modell „komoly lépést jelent a mesterséges általános intelligencia (AGI) felé”, de persze, mi mást mondjon, amikor tavaly novemberben már 2025-re jósolta az AGI eljövetelét?

Forrás

Az elmúlt évben egyébként is teljesen elszabadult a hype-kultúra a mesterséges intelligencia (AI) világában, nem teljesen függetlenül attól sem, hogy a technológiai témájú nagyotmondás királya, Elon Musk is aktivizálta magát, és a Grokkal a maradék méltóságától is megfosztotta az X-et. Aztán jöttek a néhány napig tartó kínai csodák, az eleinte a világtőzsdét is megrengető, majd csúfos kudarcot valló DeepSeek vagy épp a Manus, ami csak azért bukkant fel nemrég újra a közbeszédben, mert az OpenAI is kijött az első ágensével – ezt a nevet találták ki a komplex feladatok megtervezésére és elvégzésére különböző eszközök használatával alkalmas AI-rendszereknek.

A gondos promptolás vége

Pedig a GPT–5 valójában még csak nem is egy modell, mint számozott elődei, hanem egy több modellt magába foglaló hibrid, ami maga dönti el, hogy melyik a leginkább alkalmas a felhasználó kiszolgálására. Ez annyit tesz, hogy nem kell többé kiválasztani, hogy a gyors válaszadásra vagy a hosszabb gondolkodásra és ezáltal pontosabb válaszadásra képes modellre van szükségünk, hanem a bepötyögött kérdésünk (vagy más promptunk) alapján a rendszer automatikusan azt a modellt (gyors vs. érvelő) dolgoztatja, amelyik a legjobban illik hozzá. Hogy pontosan mi alapján? „A beszélgetés típusa, összetettsége, eszközigényei és kifejezett szándék alapján (például, ha azt írod a promptban, hogy »gondold át alaposan«)” – írja az OpenAI.

Vagyis tényleg léptünk egyet az AGI felé, ha csak egy nagyon kicsit is – innentől nem kell eligazodni az OpenAI szerencsétlenül elnevezett modelljei között (az o3 jobb mint a 4o, de néha az o1 a legjobb választás), hanem a rendszer automatikusan kiválasztja a legmegfelelőbbet. Az AI-szakíró Ethan Mollick egész egyszerűen úgy jellemezte a GPT–5-öt, hogy „csak csinál dolgokat”, ami alatt azt érti, hogy gyakorlatilag véget ért a gondos promptolás korszaka, mert az új modell már sokkal egyszerűbb szöveges utasításra is nagy eséllyel azt hajtja végre, amire gondoltunk – sőt akár azt is, amire nem is gondoltunk.

Mollick például egy egymondatos promptban arra kérte az új modellt, hogy készítsen egy építőprogramot, amivel egyszerűen lehet brutalista épületeket létrehozni és szerkeszteni, és néhány percen belül már a rendelkezésére is állt egy komplett 3D-s program. Később párszor beírta, hogy „javíts rajta”, és a GPT–5 csak ennyi alapján, kifejezett kérés nélkül neonfényekkel, közlekedő autókkal, új kameraállásokkal vagy mentési funkcióval egészítette ki a programot.

Az egymondatos prompttal létrehozott építőprogram

Forrás: Ethan Mollick

„Régebben gondosan promptoltam az AI-t, hogy azt kapjam, amit kértem. Most már csak nagyjából rámutatok, hogy mit szeretnék. És ez valahogy működik” – írja Mollick.

Okosabb, gyorsabb, hasznosabb, pontosabb

A nagy ígéretek persze most sem maradhattak el, de ezekről majd a következő napokban-hetekben derül ki, hogy tényleg megállják-e a helyüket: „Jelentős előrelépést értünk el a hallucinációk csökkentése, az utasítások követésének javítása és a hízelgés minimalizálása terén, és javítottuk a GPT–5 teljesítményét a ChatGPT három leggyakoribb felhasználási területén: írás, kódolás és egészségügy” – írja az OpenAI. A kevesebb hamis információ mellett fontos ígéretnek tűnik még, hogy a memóriája is kibővült, vagyis hosszabb távon tud kontextust értelmezni.

Az egyesített modellcsalád persze a háttérben több különböző variánst takar: a ChatGPT ingyenes és fizetős (Plus) verziójába egyaránt beépítették a GPT–5-öt és a GPT–5-minit, de az ingyenes változatban jóval korlátozottabb lesz az erősebb modell használata – a 229 eurós Pro csomagban ez is korlátlan, persze. Az alkalmazásfejlesztők egy még kisebb verziónak, a GPT–5-nanónak is örülhetnek, a még gyorsabb és olcsóbb nano viszont csak az API-ban elérhető.

Az, hogy egyedülálló módon rögtön elérhetővé tették az új modellt az ingyenes felhasználóknak, arra is utal, hogy a korábbiaknál lényegesen olcsóbb a működtetése – ami biztató fejleményt jelentene a világ energiáját felzabáló adatközpontok környezeti lábnyomára nézve.

Bár a GPT–5 több benchmarkon is elérte a legmagasabb szintet, például az ágensi képességek egy tesztjén, valamint olyan kódolási értékelésekben, mint az SWE-Bench és az Aider Polyglot, Célmentine Fourrier AI-kutató az MIT Technology Review-nak elmondta, ezek az értékelések ma már korántsem jelentenek annyit, mint akár 1-2 évvel ezelőtt, hiszen a mai modellek már mind közel vannak a maximumhoz – amire nemrég az emiatt hamarosan AI-hullámvölgyet jósló Yann LeCun is figyelmeztetett.

Kapcsolódó cikkek a Qubiten: