Videógenerátor, ChatGPT Pro, beszélgetés a Mikulással – félidőnél jár az OpenAI 12 napos karácsonyi akciója
Az év utolsó hetei különösen kedvesek napjaink egyik legfontosabb vállalatának, az OpenAI-nak. A céget 2015 decemberében alapították, a ChatGPT 2022 novemberének utolsó napján adták ki, idén pedig egy 12 napon (pontosabban 12 munkanapon) át tartó bejelentéssorozattal ünneplik meg, hogy már két éve megkerülhetetlennek számítanak a techvilágban – és tulajdonképpen a mindennapokban is.
A december 6-án elindult 12 Days of OpenAI egyfajta adventi kalendáriumként működik: minden napra jut egy bejelentés valamilyen új termékről vagy funkcióról. Ez a lépés nemcsak arról árulkodik, hogy a sosem látott módon, robbanásszerűen növekedő cégnél milyen intenzív munka folyik a mesterséges intelligenciával, hanem arról is, hogy hiába a sok különböző AI-fejlesztő és a még több különböző AI-termék, chatbot, képgenerátor stb., az OpenAI érti a legjobban, hogyan lehet felcsigázni az emberek (és a média) érdeklődését a legújabb fejlesztések iránt.
És már csak azért is megéri odafigyelni arra, hogy az OpenAI milyen új eszközöket tesz elérhetővé, mert ebből látszik igazán (legalábbis felhasználói szinten), hogy mekkora a szakadék az AI-prédikátorok nagyotmondása és a valóság között. Sam Altman, az OpenAI vezére sem fukarkodik a szenzációs kijelentésekkel: november elején arról beszélt, hogy a minden emberi feladat elvégzésére képes mesterséges általános intelligencia (AGI) eljövetelére már 2025-ben számítani lehet, míg egy december eleji eseményen hozzátette, hogy a közelgő gépi szuperintelligencia olyan hatással lesz a világgazdaságra és a munkahelyek, munkakörök felforgatásával a társadalomra is, mint a 20. század közepén a tranzisztorok és a mikrochipek voltak.
A verseny ráadásul fokozódik, ami szintén hajtja az innovációt és fokozza annak ütemét. A Google épp tegnap mutatta be Gemini 2.0 chatbotját, az egykori OpenAI-munkatársak által alapított Anthropic október végén mutatta be Claude chatbotjának új képességét, miszerint már önmagától tud számítógépezni (kielemezni a képernyőt, kurzort mozgatni, klikkelni, írni a billentyűzeten), az új iPhone-t már az Apple Intelligencia funkcióival igyekeznek eladni, és akkor olyan szereplőkről még nem is beszéltünk, mint a Microsoft vagy a Meta.
Végül még egy szempont, amiért érdemes legalább fél szemünket az OpenAI-on tartani: éppen a 12 Days of OpenAI kezdete előtt, december 4-én jelentették be, hogy a cég leszerződött az Anduril Industries nevű haditechnológiai vállalattal, amely autonóm rendszerek (drónok, elhárító- és megfigyelőrendszerek) fejlesztésével foglalkozik, és amely az amerikai hadügyminisztérium egyik beszállítója. Az OpenAI szabályzata korábban kifejezetten tiltott minden hadipari elköteleződést, ám idén januárban hirtelen eltűnt az erről szóló passzus a használati feltételek közül. Vagyis egyre inkább úgy tűnik, hogy nem igazán számít, hogy éppen mit mond az OpenAI és Sam Altman, a nézeteik bármikor változhatnak – emlékezzünk csak arra, hogy az alapítási szándék szerint nyílt, nonprofit cég az első valódi üzleti lehetőségnél bezárkózott, és már egyértelműen az üzleti logika szerint működik.
De nézzük, mit hozott eddig, és mit hozhat még a karácsonyig tartó bejelentéscunami!
1. nap: Havi 200 dollárért jön a ChatGPT Pro
Ha a hadipari szerződésből, a Microsoft-együttműködésből való ragaszkodásból vagy a ChatGPT-ben megjelenő hirdetések belengetéséből nem lett volna egyértelmű, az OpenAI-nak kell a pénz, de nagyon. A techóriások között kis cégként kell elcsábítaniuk a legjobb szakembereket, fenn kell tartani az óriási (heti 300 milliós) felhasználói bázist kiszolgáló szervereket, és persze az innováció sincs ingyen. Ezekből következik, hogy a havi 20 dolláros ChatGPT Plus már nem elég, ezért bevezetik a ChatGPT Prót, amely havonta 200 dollárba (mai árfolyamon 78 ezer forintba) kerül. Hogy mi kerül ezen ennyibe, az két nappal később derült csak ki.
2. nap: Megerősítéses finomhangolás
Ez leginkább a szakiknak szól. A bejelentés egy olyan fejlesztői programra vonatkozik, amelyben nagyon kevés adatból nagyon jó, specifikus nyelvi modelleket lehet gyártani valamilyen szakterületre. Az alfa tesztelésre már lehet jelentkezni, de a szélesebb körű program 2025 elején indul.
3. nap: Az eddigi legnagyobb dobás, a Sora
Hogy mi kerül 200 dollárba a ChatGPT Pro-előfizetésen? Hát a videógenerálás. A szövegből rövid videókat gyártó Sora modell az OpenAI legújabb szenzációja, ami akár állóképek animálására vagy létező videók remixelésére is alkalmas. A ChatGPT Plus előfizetői 50 darab 720p felbontású, legfeljebb 5 másodperces videó legyártására elég kreditet kapnak egy hónapban, de a Pro csomag felhasználói már 500 darab 1080p felbontású, akár 20 másodperces videót is készíthetnek havonta, ráadásul nekik már vízjelet sem tesz a videókra a Sora. A várva várt eszköz Magyarországon egyelőre nem elérhető, úgyhogy valószínűleg az ünnepi bejelentések javát csak jövőre élvezhetjük.
4. nap: Osztott képernyős szerkesztés
A ChatGPT felületének eddigi legnagyobb frissítését a vászon (canvas) funkció megjelenése jelenti, ami lényegében abban segít, hogy a ChatGPT jobban megértse és kontextusba tudja helyezni azt, amit a felhasználó el szeretne érni. Ez úgy néz ki, hogy a chatbot képernyője két részre oszlik, így az oldalsó sávban szerkeszteni lehet az üzeneteken vagy ki lehet emelni fontos szövegrészleteket, így nem kell újabb és újabb üzenetekben, lineárisan kérni a válaszok finomítását. A béta üzemmódban elérhető interfész hamarosan az ingyenes változatba is bekerül az OpenAI ígéretei szerint.
5. nap: A ChatGPT és az Apple
Az ötödik nap a ChatGPT Apple-termékekkel való integrálásáról szólt. Bemutatták, hogy az iOS 18.2-től kezdődően hogyan válik okosabbá Siri az OpenAI modelljeinek köszönhetően, vagy hogy mire képes az Apple Visual Intelligence funkciója a ChatGPT-vel párosítva: mondjuk arra, hogy egy kép alapján kiválassza, három ember közül kinek a karácsonyi pulcsija a legmenőbb. Természetesen Sam Altman nyert – mert volna mást mondani.
6. nap: Hangos beszélgetés videókép alapján
A csütörtöki napot bocsánatkéréssel kényszerült kezdeni az OpenAI, miután szerdán több órán keresztül nem volt elérhető a ChatGPT – ami jól jelzi egyrészt a felhasználói érdeklődést, másrészt azt, hogy a világ összes szervere és adatközpontja sem lesz elég a cégnek, ha ilyen ütemben növekednek tovább.
Aztán rátértek a hatodik napi meglepetésre: a ChatGPT Advanced Voice Mode nevű hangos funkcióját hamarosan videóval és képernyőmegosztással is lehet használni. Ez azt jelenti, hogy a ChatGPT ezentúl a szelfikamera képét is ki tudja majd elemezni, és valós időben hanggal kommentálni – ezt azzal demonstrálták, hogy egy kávéfőző használatához élő videókép alapján adott hangos tanácsokat a chatbot. De ha ez nem lett volna elég, még egy ünnepi funkciót is beépítettek a hangos üzemmódba: a megszokott hangokon túl most már a Télapóval (aka. Mikulás, aka. Santa Claus) is lehet beszélgetéseket folytatni.
Ahogy a Sora érkezését várni lehetett, úgy akadnak még az OpenAI-nak olyan korábbi tervei, amelyek közül beleférhet még valami a hátralevő hat napba. Ilyen például az Operator nevű AI-ágens, amely (az Anthropic fent említett újdonságához hasonlóan) már több feladatot is képes elvégezni automatikusan: magától kódol, lefoglalja a repülőjegyet vagy már nemcsak megírja, de el is küldi az emailt a böngészőből a megfelelő címzettnek. Adós még az OpenAI egy ChatGPT-alapú webböngészővel (főleg, mióta a Google Chrome aktívan hasznosítja a Geminit) és a mobilapp után egy asztali alkalmazással is, de hardveres fronton is lehet újdonságokra számítani – például ideje lenne már, hogy kiderüljön, min kezdett el dolgozni több mint egy éve az iPhone-t tervező Jony Ive és Sam Altman.
A bejelentéseket december 20-ig minden munkanapon, magyar idő szerint 19 órától lehet követni az OpenAI oldalán.
Kapcsolódó cikkek a Qubiten: