A Google már komplex feladatokra utasítható robotokat tanít be a legfejlettebb nyelvi modelljével

A Qubit a szabad és tájékozott magyar nyilvánosságért dolgozik. Segítsd a munkánkat!

A Google mérnökei kedden áttörő fejlesztésről számoltak be: olyan robotokat terveztek, amelyek a nagy nyelvi modelleknek nevezett mesterséges intelligenciát (AI) használó szoftverek segítségével a mindennapi feladatok elvégzésében segíthetnek az embereknek. Ez azt jelenti, hogy ahelyett, hogy a robotoknak már nem kell lépésenként minden egyes feladatra utasítást adni, mert azok az emberekhez hasonlóan komplex kérésekre is képesek reagálni.

A Washington Post beszámolója szerint például a Google bemutatóján az egyik kutató azt mondta egy robotnak, hogy „Éhes vagyok, tudnál hozni nekem egy kis harapnivalót?”, mire a robot végigkutatta a konyhát, kinyitott egy fiókot, majd megragadott egy zacskó chipset, és odavitte az embernek.

A Google szerint ez az első alkalom, hogy a számítógépes felületeken keresztül már jól ismert nyelvi modelleket (mint a GPT-3 vagy a DALL-E), fizikai robotokba integrálták. A kutatók elmondták, hogy mára mindennapossá váltak a robotok, és milliószámra dolgoznak a világ gyáraiban, de azok csak konkrét utasításokat tudnak követni, és legfeljebb egy vagy két feladatra koncentrálnak. A nagy nyelvi modellekkel felruházott robotok ezzel szemben a mindennapi feladatok széles skáláját képesek elvégezni, és még tanulnak is munka közben – a világ legnagyobb techcégei évek óta versenyeznek az ilyen robotok tervezéséért.

A Google kísérleti házirobotjaFotó: Google

A nyelvi modellek úgy működnek, hogy az interneten található, hatalmas mennyiségű szöveget dolgoznak fel, és AI-alapú szoftverekkel megjósolják, hogy az egyes szavak és mondatok után milyen más szavak és mondatok következhetnek, vagy épp a kérdésekre milyen válaszokat lehet adni. A tanulási folyamat során olyan jól képesek megjósolni az egymás után következő szövegrészeket, hogy az emberi nyelvhasználatra félelmetesen hasonló megoldásokkal élnek, így az ilyen nyelvi modellekre épülő chatbotokkal már olyan lehet egy beszélgetés, mintha egy emberrel beszélnénk.

Zac Stewart Rogers, a Coloradói Állami Egyetem ellátásilánc-menedzsmenttel foglalkozó adjunktusa szerint a nyelvi modelleket használó robotok a gyártási és elosztó létesítmények működését is megváltoztathatják: „Amikor egy ember és egy robot együt dolgozik, abból mindig termékeny munka sül ki. A robotok elvégzik a nehéz kézi munkát, az emberek pedig a finomhangolást.” Bár ez sok helyen már most is így megy, az összetett feladatok elvégzésére is képes robotok megjelenése jelentősen csökkenthetik az emberi munkaerő igényét, és a logisztikai központok méretét (így azok energiaigényét) is.

A Google házon belül már alkalmazza is a cég eddigi legfejlettebb nyelvi modelljével (PaLM) felruházott robotokat, amelyek a vállalati étkezdékben pultot törölnek és kidobják a szemetet. De nem a Google az egyetlen cég, amely hasonló fejlesztéseket végez: az Amazon nemrég autonóm raktáros robotot mutatott be, a Tesla pedig tavaly jelentette be, hogy humanoid robotok gyártásába kezd – persze könnyen lehet, hogy utóbbi egyelőre csak koncepció szintjén létezik Elon Musk fejében.

A Google mindenesetre igyekszik az AI-alapú megoldásait jobb színben feltüntetni az elmúlt hetek nagy botránya után – a cég június közepén kényszerszabadságra küldte Blake Lemoine-t, a szoftvermérnököt, aki érző lénynek nevezte a Google legújabb AI-fejlesztéseiből született LaMDA-t. A chatbot ezután állítólag ügyvédet kért, és Lemoine szerzett is neki egyet, de a mesterséges intelligenciát kutató szakértők mellett filozófusok is vitatják, hogy a számítógépes modell emberi tulajdonságokkal bírna.

Kapcsolódó cikkek a Qubiten: