Itt a Claude 3.5 Sonnet, ami fejlesztői szerint a ChatGPT-t is lekörözi

Tóth András

2024.06.21. · TECH

Az amerikai Anthropic hétfőn bemutatta legújabb chatbotját, a Claude 3.5 Sonnetet, amely okosabb és gyorsabb a mindössze három hónappal ezelőtt kiadott elődjénél, és még a ChatGPT-t is megszorongatja. A bejelentés jól illusztrálja, hogy milyen éles verseny zajlik az AI-cégek között, amelyek egyre szűkebb időközönként próbálnak chatbotjaikkal egymásra licitálni.

A cég által egy online felületen és iOS-alkalmazáson keresztül rögtön elérhetővé tett új modellt regisztráció után bárki ingyenesen használhatja. A rövid tesztjeink során leginkább a Claude 3.5 Sonnet válaszainak gyorsasága volt szembetűnő, ami egybevág azzal, hogy az új verzió kétszer gyorsabb, mint az előző Claude 3 modellcsalád legfejlettebb verziója, az Opus.

photo_camera A Claude 3.5 Sonnet az iOS-es alkalmazásban Fotó: Tóth András/Qubit

A Sonnet a Claude 3 középső fejlettségű modellje volt, ehhez képest az 3.5-ös kiadás az Anthropic szerint a benchmarkok többségén lekörözi a Claude 3 Opust is. A cég által kiválasztott kilenc mérőszámból hétnél a Claude 3.5 Sonnet felülkerekedik az OpenAI legjobb modelljén, a GPT–4o-n, a Google Gemini 1.5 Próját pedig mindegyiken megveri. Az új modell jobban megérti a komplex utasításokat, a humort és az árnyaltabb kommunikációt, továbbá hatékonyabban teljesít a kódírásban és a több lépéses munkafolyamatok elvégzésében.

Ezeket a benchmarkokat a Verge szerint azért óvatossággal kell kezelni. A cégeknek könnyű kiválasztani azokat, amik a modelljeiket a legjobb színben tüntetik fel, amik az értékeléseken egyébként is folyamatosan előzgetik egymást, ahogy kicsit is frissítenek rajtuk. A felhasználói értékelések alapján a chatbotokat összehasonlító Chatbot Arénán még nem szerepel a 3.5 Sonnet, de a LiveBench ranglistán messze lekörözte a GPT–4o-t, és a Claude 3 Opust is.

Az Anthropic márciusban mutatta be a tudásukban GPT–4 kategóriájú Claude 3 modelleket, amik körül azonnal hatalmas hype kerekedett a többi chatbotnál emberibbnek tűnő válaszaik miatt. Ezután az OpenAI és a Google is új AI-modelleket jelentett be, majd érkezett az Apple, amely az eszközökön futó Apple Intelligenciával és az OpenAI által megtámogatott Sirivel szeretne felülkerekedni Google-ön és a Microsofton. Az Anthropic azt igéri, hogy még idén érkezik a 3.5-ös modellcsalád legfejlettebb modellje, az Opus, amely még nagyobb előrelépést jelenthet.