Hátborzongató dalokat írt az OpenAI mesterséges intelligenciája a legnagyobb sztárok stílusában
A többek között Elon Musk által alapított, a mesterséges intelligencia kutatásával foglalkozó OpenAI egy olyan generatív modellt dolgozott ki, amely lehetővé teszi, hogy konkrét zenei stílusok és számok elemzése után teljesen új, automatizált dalok szülessenek. Az eredmények pont olyan zavarba ejtőek, amilyennek első hallásra tűnnek.
A Jukebox nevű projekt során a kutatók először nyers hangfájlokat tápláltak konvolúciós neurális hálózatokba (CNN), amelyek fogyasztható mértékűre (44 100 helyett 344 mintára másodpercenként) tömörítették és kódolták az adatokat, vagyis olyan elemekre bontották a dalokat, amelyekből aztán új struktúrákat lehet felépíteni.
A tömörített hangelemekből és egy dalszövegeket gyűjtő oldalra rászabadított algoritmus által létrehozott új szövegekből aztán egy úgynevezett transzformátor segítségével teljesen új dalokat generáltak, amiket a CNN-ek végül úgy dekódoltak, hogy ismét 44 100 mintából álljanak másodpercenként, tehát – legalábbis a kutatók reményei szerint – realisztikus hangzású dalok szülessenek. A kutatók összesen 1,2 millió dalt tápláltak a rendszerbe.
Ezt az Elvis-dalt például egy automatikusan generált dalszöveggel hozták létre, így lipidekről, sejtekről és lábujj-nővérekről is szó esik benne:
Az is kiderült, hogy a mesterséges intelligencia egész jól tudja hozni a Bon Jovi szintjét dalszerzésileg, még akkor is, ha Meghan Trainor Can't Dance című számának dalszövegét énekeltetik el a gép-Jonnal:
Elton John ellenben meglepően jól áll a mesterséges intelligenciának:
Abból viszont elég érdekes dolgok jönnek ki, amikor modern popslágereket próbál írni a rendszer. Ez például a digitális Katy Perry, ahogy azt énekli: „mély tanulás, big data / nagy modell, pontosság / mélyebbre, mélyebbre kell mennünk”.
A hiphoppal viszont érezhetően nem tud mit kezdeni egyelőre a mesterséges intelligencia, amit jól mutat Kendrick Lamar Element című számának gépi újraértelmezése is:
„Bár a Jukebox egy nagy lépés a zenei minőség, a koherencia, a hangminta hossza, valamint az előadók, műfajok és dalszövegek feldolgozása terén, még mindig jelentős szakadék van az így generált dalok és az emberek alkotta zene között. Míg a generált dalok zenei összefüggést mutatnak és hagyományos akkordmeneteket követnek, sőt esetenként lenyűgöző szólókat is felmutatnak, nem találunk bennük olyan ismerős zenei struktúrákat, mint például az ismétlődő refrének” – írták a kutatók a projekt korlátairól.
Az írásaiban a zene és a technológia átfedéseit vizsgáló Cherie Hu a Twitteren arra is felhívta a figyelmet, hogy a Jukeboxhoz hasonló projektek igazi katasztrófát jelenthetnek a szerzői jogok területén.
„Vajon Kanye West, Katy Perry, Lupe Fiasco vagy Aretha Franklin, Frank Sinatra és Elvis Presley jogutódjai engedélyezték, hogy az OpenAI felhasználja a felvételeiket egy hangszintetizáló, dalszerző, dalszövegíró algoritmus betanítására? Az a tippem, hogy nem” – írta Hu a Twitteren.
Az összes dal között a Jukebox oldalán lehet böngészni.
Kapcsolódó cikkek a Qubiten: