Cupertino üzeni: érkezik az Apple Intelligencia

06.11. · TECH

Hétfő este végre az Apple is beadta a derekát az AI-őrületnek, és bemutatta az eszközein futó Apple Intelligenciát, amely Tim Cook vezérigazgató szerint a következő nagy lépést jelenti a vállalatnak, valamint az okosabb Sirit, amely akár az OpenAI legújabb, GPT-4o modelljét is képes lesz használni.

Az idén június 10-én kezdődő éves fejlesztői konferencia, a WWDC első napján a cupertinói vállalat hagyományosan a számítógépein, tabletjein, okostelefonjain és okosóráin futó operációs rendszerek új változatairól rántja le a leplet. Az Apple Park campuson előre rögzített prezentáció bevezetőjében Tim Cook, az Apple vezérigazgatója azt ígérte, hogy a platformjaikat működtető szoftverek minden korábbinál okosabbak és hasznosabbak lesznek a mindennapokban.

Tim Cook, az Apple vezérigazgatója az Apple Park campus tetejéről nyitotta meg a WWDC konferenciát
photo_camera Tim Cook, az Apple vezérigazgatója az Apple Park campus tetejéről nyitotta meg a WWDC konferenciát Fotó: Apple

A bemutatón az Apple egy óra alatt átrohant a Mac, iPad, iPhone és Apple Watch rendszereinek új funkcióin, amelyekből jelentősen kevesebb volt a korábbi években megszokotthoz képest. A fókusz egyértelműen a mesterséges intelligencián volt, amivel a második, közel háromnegyed órás blokk foglalkozott. Ez annak fényében nem is meglepő, hogy az Apple-nek fel kellett zárkóznia vetélytársaihoz, a Google-höz, a Microsofthoz és a Samsunghoz, akik eszközeiket és platformjaikat már hónapokkal ezelőtt telerakták nagy nyelvi modellekkel (LLMs) és generatív AI funkciókkal – és mindezt a többé-kevésbé a vállalat védjegyévé vált, az adatvédelmet priorizáló módon kellett elérniük.

Az elmúlt egy hónapban a vezető AI-cégek és techvállalatok egymásra licitáltak, hogy ki tud nagyobbat dobni a mesterséges intelligencia terén. Az OpenAI május 13-án tárta a világ elé az új GPT–4o modellt, ami a multimodalitásra ment rá – vagyis arra, hogy a chatbot szöveges képességei mellett javítsanak a fotófelismerésén vagy a szóbeli és videós beszélgetés módon.

Sam Altman, az OpenAI vezérigazgatója a Microsoft Build konferenciáján 2024. május 21-én
photo_camera Sam Altman, az OpenAI vezérigazgatója a Microsoft Build konferenciáján 2024. május 21-én Fotó: JASON REDMOND/AFP

Egy nappal később a Google-nél szintén a multimodalitás volt a jelszó, és a demóvideóik szintjén legalábbis úgy tűnt, hogy a szöveget, tárgyakat, tájképet felismerő AI egyre hasznosabbá válhat a mindennapokban. Május végén a ChatGPT jelentőségét elsők között felismerő Microsoft következett, amely minden korábbinál mélyebben integrálta a mesterséges intelligenciát a Windows operációs rendszerébe, az új ARM-architektúrán alapuló Qualcomm-chipeknek köszönhetően.

Mi ez az Apple Intelligencia, és mit tud majd a ChatGPT-vel felturbózott Siri?

A WWDC-n az első AI-ízelítő az Apple kiterjesztettvalóság-szemüvegére, a Vision Próra érkező új VisionOS 2 rendszer bemutatójakor érkezett: a fotóalkalmazás fejlett gépi tanulási algoritmusokkal képes lesz térbeli fotókat csinálni a normál képekből, természetes mélységérzettel. A 3500 dolláros Vision Pro, amelyet márciusban próbáltunk ki, a következő hetekben az Egyesült Államokon kívül is elérhetővé válik, köztük az Egyesült Királyságban, Franciaországban és Németországban.

Az új rendszerek bemutatásakor még néhányszor elhangzott a gépi tanulás kifejezés, de az összefüggő vízió az Apple Intelligencia említésénél tárult fel igazán. Ez a vállalat szerint egyszerre nagy teljesítményű, könnyen használható, jól integrált az operációs rendszerrel, személyes és természetesen privát. Az Apple az egészet egyfajta személyes intelligenciaként írta le, amely a rólunk az iPhone-unkon, iPadünkön vagy Macünkön tárolt információ alapján releváns találatokat tud feldobni, vagy ezáltal hasznos lépéseket képes tenni.

Az Apple Intelligencia a telefonunk alkalmazásaiban tárolt adatok és tevékenységünk alapján jobban ért majd minket, amitől a cég szerint tényleg hasznosnak bizonyul majd. Erre példaként azt hozták fel, hogy a telefonunk képes lesz megállapítani, odaérünk-e lányunk színházi előadására, miután kapunk arról egy e-mailt, hogy egy munkahelyi megbeszélést későbbre halasztottak. Az a bemutatóból nem volt egyértelmű, hogy ezt a képességet akkor is ki tudjuk-e aknázni, ha nem az Apple gyári e-mail vagy naptár alkalmazását használjuk.

Craig Federighi, az Apple vezető szoftvermérnöke bemutatja az Apple Intelligenciát
photo_camera Craig Federighi, az Apple vezető szoftvermérnöke bemutatja az Apple Intelligenciát Fotó: Apple

Az új AI hozza a kötelezőt is: más nyelvi modellekhez hasonlóan képes szövegeket értelmezni, azokat összefoglalni, és kiemelni a lényeges információkat. Ez például a Safari böngészőben mutatkozik majd meg, vagy a mindent elöntő értesítések hatékonyabb szelektálásában és a fontosabbak kiemelésében. Emellett egy, az iOS-be, iPadOS-be, és macOS-be integrált, a Microsoft Copilothoz hasonló segédet is kapunk, amely kijavítja majd e-mailjeinket, vagy éppen szebben átfogalmazza azokat, ha arra kérjük. Az Apple Intelligenciával tudunk majd hívásokat is rögzíteni, és a felvételek alapján automatikus leirat készítésére is lesz lehetőség.

Csakúgy, mint a Copilotnál, lesz beépített képgenerátor is, amivel az Üzenetek alkalmazásban és más helyeken tudunk majd képeket és animációkat készíteni, miután kiválasztjuk azok kívánt stílusát és témáját. De az Apple nem állt itt meg, és bemutatta a Genmojit, amivel a legőrültebb tetszőleges AI-emojikat tudjuk legenerálni, hogy utána barátainkat szórakoztassuk velük. A dj-ző mókust valószínűleg nehéz lesz felülmúlni.

Itt vannak a Gemojik!
photo_camera Itt vannak a Gemojik! Fotó: Apple

A Fotók alkalmazás sem maradt ki a mesterségesintelligencia-zuhatagból, de az új funkciók a korábban a Google vagy a Samsung által bemutatottaknál jóval korlátozottabbaknak tűnnek: az app okosabb keresőt kap, ami már a videók egy-egy pillanatára is rátalál majd, képes lesz az általunk kiválasztott fotókból kisfilmet készíteni, de a szerkesztőben a zavaró tárgyakat (vagy embereket) is eltüntethetjük a fotóinkról.

A cég szerint az Apple Intelligencia tervezésének középpontjában az adatvédelem állt, és ennek érdekében a képességeit megalapozó nagy nyelvi modellek közvetlenül az eszközön futnak, a chipekbe épített hardveres AI-gyorsítókon (Neural Engine). Vannak azért kivételek, amikor az adott feladathoz nagyobb modellekre van szükség, amiket csak szerverek tudnak meghajtani: az Apple erre is kitalált egy megoldást, ami jobban fókuszál az adatvédelemre, a privát felhőszámítást, amit speciális Apple-chipekkel szerelt szerverekkel garantálnak, és azt ígérik, hogy ezeken felhasználói adatokat semmiképp sem tárolnak majd.

Az Apple Intelligencia után a Siri következett. A 13 évvel ezelőtt bemutatott hanginterfész igazán sosem töltötte be a hozzá fűzött nagy várakozásokat, és nem tudott kitörni az „állíts be egy 10 perces időzítőt” vagy „esik-e éppen” jellegű felhasználási szintről. A cupertinóiak reményei szerint ez most megváltozik, méghozzá azáltal, hogy a Siri jobban érti majd a kontextusát annak, amit mondunk neki, és képes lesz egy-egy, egymás után feltett kérdés között megjegyezni információkat, és a későbbiekben a kijelzőn megjelenő dolgokat értelmezni.

Az est talán legnagyobb dobása, ahogy arra a pletykák alapján számítani lehetett, az OpenAI-jal bejelentett partnerség volt. Az AI-cég legújabb, GPT-4o modellje leginkább két helyen jelenik majd meg: a Copilot-szerű szöveggenerátorban és a Siriben, ami egyes esetekben hozzá tud férni, és ha engedélyezzük, elküldi neki a kérdésünket, amire aztán a chatbot legenerálja a választ. Az Apple szerint a chatbot ezekre a funkciókra ingyenesen használható lesz, ChatGPT-fiók vagy -előfizetés nélkül is. A ChatGPT-integráció az év végétől lesz elérhető, és a jövőben további AI-modelleket is terveznek a rendszerbe integrálni.

Így néz majd ki a macOS-be integrált ChatGPT
photo_camera Így néz majd ki a macOS-be integrált ChatGPT Fotó: Apple

Az Apple Intelligencia mindössze csak két iPhone-modellen, a tavaly kiadott iPhone 15 Pro és iPhone 15 Pro Maxon fut majd el, azok A17 Pro chipjeinek fejlett AI-képességei miatt. Az iPadeknél már jobb a helyzet, mert minden M1, M2 és M4 chippel rendelkező modellen működik majd, és ugyanerre lehet számítani a Macek esetén is, kiegészülve az M3 chippel és változataival. Az Apple mesterséges intelligenciája teljesen ingyenesen használható lesz, de kezdetben csak az amerikai angolt támogatja, további nyelveket később adnak majd hozzá.

Személyre szabottabb iPhone és számológép az iPadre

Az idei legnagyobb dizájnváltozás az iPhone és az iPad főképernyőjét érinti majd, ahol az iOS és iPadOS 18-tól kezdve bárhova el tudunk majd helyezni ikonokat, és tetszőlegesen átszínezhetjük őket. Eközben a vezérlőközpont is átesett egy enyhe ráncfelvarráson, és külön oldalakat kap a zenelejátszás vagy az okosotthon vezérlése, sőt mostantól kicserélhetjük a zárolási képernyő két gyorsgomb ikonját is, amelyek eddig mindig a lámpát és a kamerát aktiválták.

Bárhova áthelyezhető és átszínezhető ikonok az iPhone főképernyőjén
photo_camera Bárhova áthelyezhető és átszínezhető ikonok az iPhone főképernyőjén Fotó: Apple

Az Üzenetek alkalmazás is bővült néhány nem-AI funkcióval: ezentúl több reakció közül választhatunk majd, ütemezhetjük az üzeneteket, ráadásul az app végre támogatni kezdi az RCS szabványt, amivel az iMessage-hez hasonló funkciókkal kommunikálhatunk majd Androidot használó ismerőseinkkel. Az iPhone 14 és a későbbi modellek a támogatott országokban – Magyarországon egyelőre nem – műholdas hálózaton keresztül is tudnak majd iMessage és SMS üzeneteket küldeni és fogadni, ami nem túl jó hír a drága műholdas kommunikátorokat áruló cégeknek.

De mi az, amire még a tényleg okos Sirinél is egy évvel többet kellett várni, és most megérkezett? Nem más, mint a Számológép alkalmazás az iPadre, ami képes lesz tudományos kalkulációkra, mértékegység-átváltásra, és még egy Apple Pencil ceruzával használható grafikus számológépet is kap. A funkciók egy része elérhető lesz a Jegyzetek alkalmazásban, ami szintén okosodik, és egy gépi tanulási algoritmussal automatikusan megszépíti majd a kézírásunkat, hogy az könnyebben olvasható legyen. A legnagyobb áttervezésen kétségtelenül a Fotók alkalmazás esett át: új nézetével az Apple szerint könnyebb lesz megtalálni fontos emlékeinket.

A csoda, amire 14 évet kellett várni: Számológép az iPaden
photo_camera A csoda, amire 14 évet kellett várni: Számológép az iPaden Fotó: Apple

A macOS új verziója két, a Windows felhasználóknak már régóta ismert képességgel gazdagodik: a képernyő széléhez vagy sarkaihoz húzott ablakok innentől odatapadnak majd és automatikusan elfoglalják a kijelző felét vagy negyedét, valamint egy új alkalmazással megoszthatjuk az iPhone-unk képernyőjét a Macünkkel, és wifin keresztül távolról használhatjuk azt.

Így néz ki a wifin keresztül vezérelhető iPhone a Mac-en
photo_camera Így néz ki a wifin keresztül vezérelhető iPhone a Mac-en Fotó: Apple

Okosodnak az AirPods fülhallgatók is: egy fejbiccentéssel fogadhatunk velük hívást, fejrázással pedig elutasíthatjuk – így ha az utcán ősztől ilyen jelenetekkel találkozunk, ne lepődjünk meg túlzottan: csak az Apple új, gyorsulásmérők és gépi tanulási algoritmusok által lehetővé tett funkcióinak előnyeit élvezik az iPhone-tulajdonosok.

Az AI-integrációval felturbózott új rendszerek, az iOS 18, iPadOS 18 és macOS Sequoia, valamint az Apple Watch-on futó WatchOS 11 a fejlesztőknek már hétfőtől elérhetők, az átlagfelhasználók pedig a megszokott módon ősszel kapják majd meg őket, frissítések formájában.