Fél évszázados problémát oldott meg, egy csapásra forradalmasíthatja a biológiát a DeepMind algoritmusa
Óriási lépést tett a DeepMind mesterséges intelligenciára törekvő, mélytanuló algoritmusa a biológia egyik legnagyobb kihívásának megoldása felé. A Critical Assessment of Structure Prediction (CASP) nevű, fehérje-alakzatok kialakulását előre jelző, több hónapig tartó verseny keretében a Google tulajdonában álló angol cég AlphaFold szoftvere mintegy száz másik csapatot legyőzve az esetek kétharmadában hajszálpontosan jelezte előre a rendelkezésre álló aminosav-szekvenciákból a fehérjék alakzatát, amely meghatározza azok funkcióját.
A Nature hétfői cikke szerint a november 30-án közzétett eredmény rendkívüli módon felgyorsítja azt a folyamatot, amelynek során megértjük a sejtek építőelemeit, és nagy mértékben felgyorsítja a gyógyszerfejlesztést. A DeepMind a Guardiannek úgy nyilatkozott, hogy több tudóscsoporttal már elkezdtek dolgozni a malária, az álomkór és a leishmaniasis kórokozóinak megértésén.
John Moult, a Marylandi Egyetem bioinformatikusa, aki 1994-ben hozta létre a proteinolimpiának is nevezett CASP versenyt a fehérjealakzatok kialakulásának pontosabb predikciójához rendelkezésre álló számítástechnikai módszerek fejlesztésére, úgy nyilatkozott, ezzel bizonyos értelemben ez a probléma megoldódott.
Fél órán belül megoldotta, amihez a kutatóknak egy évtized sem volt elég
A 2010-ben alapított, a Google által 2014-ben felvásárolt londoni székhelyű DeepMindot leginkább a sakkban, a góban vagy a Starcraftban elért eredményei miatt ismeri a nagyközönség, bár ezeket valójában arra használja a cég, hogy a játékokon felnőtt algoritmusokat később ráeresszék az emberiség megoldandó problémáira. Az AlphaFold szoftver már a két évvel ezelőtti CASP kihíváson is az első helyen végzett, idén azonban már annyival jobban teljesített minden más csapatnál, hogy néhány tudós egyenesen azt gondolja, forradalmat hozhat a biológiába. Andrei Lupas, a német Max Planck Fejlődésbiológiai Intézet evolúcióbiológusa szerint az AlphaFold gyakorlatilag az összes tudományterületen változást hoz az orvostudománytól a kutatáson át a biomérnöki munkáig. Lupasnak és csapatának az AlphaFold fél órán belül segített megtalálni azt a fehérjestruktúrát, amellyel a laboratórium már egy évtizede nem tudott megbirkózni.
A CASP versenyen az AlphaFold struktúra-előrejelzéseit egyes esetekben lehetetlen volt megkülönböztetni az eddig bevett módszerként használt kísérleti metódusoktól, mint amilyen a röntgenkrisztallográfia és az utóbbi években bemutatott krio-elektronmikroszkópia. Bár az algoritmus egyelőre nem iktatja ki ezeket a munkaigényes és drága módszereket, már most lehetővé teszi, hogy a kutatók újszerű módon vizsgálják a különböző organizmusokat.
Janet Thornton, az egyesült királyságbeli Hinxton Európai Bioinformatikai Intézet-Európai Molekuláris Biológiai Laboratórium strukturális biológusa azt mondta: nem gondolta volna, hogy ezt a problémát még az ő életében megoldják. Reméli, hogy a megközelítés segíti majd, hogy közelebb jussanak az emberi genomban lévő több ezernyi fehérje funkciójának felderítéséhez és a betegséget okozó génvariánsok megértéséhez.
Molekuláris origami
A sejtbiológia egyik axiómája, hogy a szerkezet meghatározza a fehérje funkcióját. Az élet építőelemeit jelentő fehérjék felelnek a sejten belüli történések legnagyobb részéért. Működésüket és feladatukat, például azt, hogy miként kontrollálja a vérben a cukorszintet az inzulin, vagy hogyan küzdik le az antitestek a koronavírust, térbeli alakzatuk határozza meg,
Míg a kutatók mára több mint 200 millió fehérjét azonosítottak, csupán töredékükhöz sikerült fehérjeszerkezetet társítani. Ezek megtalálása évtizedek óta fáradságos kísérleti módszerekkel zajlik. Az 1950-es évektől a röntgensugarakat használó krisztallográfiai módszerrel határoztak meg teljes fehérjeszerkezeteket. Ennek lényege, hogy a kristályosított fehérjéket röntgensugarak hatósugarába helyezték, és a fénytörés megmutatta a fehérjéket alkotó atomok térkoordinátáit. Az elmúlt évtizedben ezt a módszert váltotta fel sok szerkezeti biológiával foglalkozó laborban a krio-elektronmikroszkópia.
A tudományt régóta foglalkoztatja a kérdés, hogy miként alakítják ki a protein végleges formáját a fehérjék alkotóelemei, a különféle aminosavak láncolatai. Ennek felderítésére már az 1980-as években elkezdtek számítógépeket alkalmazni, amelyek azonban kifejezetten rosszul teljesítettek. A publikált módszerek egyszerűen nem működtek, ha más tudósok más fehérjékre alkalmazták őket. Ezek javítására indította Moult és csapata a CASP versenyeket, ahol a résztvevő csapatok olyan fehérjék szerkezetét igyekeznek előre jelezni, amelyeket kísérleti módszerekkel már feltérképeztek, de a struktúrát nem hozták nyilvánosságra. A proteinolimpia jó alkalom arra, hogy a gyakorlatban szerezzenek bizonyosságot arról, melyik módszer válik be, és melyik nem.
Hogyan működik az AlphaFold?
A molekuláris origami megtanításához a DeepMind egy 170 ezer fehérjeszekvenciát és szerkezetüket tartalmazó adatbázisra engedte rá az algoritmusait, és az AlphaFold néhány hét alatt kiismerte magát a fehérjeszerkezetek világában. Ezt a tanulási folyamatot követi a valódi problémák megoldása.
A szoftver első változata a neurális hálókon alapuló mélytanulás módszerével igyekezett előre jelezni a fehérjékben lévő aminosavpárok egymástól való távolságát, vagyis kétdimenziós szerkezetét, strukturális és genetikai adatok alapján. Második lépésben a program a rendelkezésre álló információk alapján olyan konszenzusos modellt alkotott, amihez már nincs szükség mesterséges intelligenciára - mondta a projektet vezető John Jumper, a DeepMind munkatársa.
A csapat ezt a módszert igyekezett továbbfejleszteni, de falba ütközött, úgyhogy kénytelenek voltak irányt váltani - mondta Jumper. A DeepMind ezért olyan neurális hálót épített, amelybe a fehérjék végleges szerkezetének kialakulását meghatározó fizikai és geometriai korlátokra vonatkozó információit is beemelte. Ezután nehezebb feladatot adtak neki: az aminosavak közötti kapcsolat előrejelzése helyett a hálózatnak egyből a célfehérje aminosav-szekvenciájának végleges szerkezetét kell megjósolnia.
Tudósokat lenyűgöző pontosság
A CASP versenyeken a közel száz célfehérjét vagy fehérjerészt fokozatosan teszik elérhetővé a csapatok számára, akik több héten keresztül dolgoznak rajtuk, amíg szerkezet-előrejelzéseiket benyújtják a zsűrinek. Az anonim módon beadott eredményeket ezután egy független tudóscsoport értékeli annak alapján, hogy mennyire hasonlít az előre jelzett fehérje a kísérleti módszerekkel meghatározott fehérjéhez.
Elképesztő pontosságával az AlphaFold számos predikciója kiemelkedett a többi közül. A mérsékelten nehéz feladatnak számító célfehérjék esetén más csapatok legjobb teljesítménye 100-ból 75 pont körüli volt, míg az AlphaFold általában 90 pontot ért el, és előrejelzései kétharmadának minősége a kísérleti módszerekkel kialakított szerkezetekével vetekedett. Néhány esetben nem is volt világos, hogy az AlphaFold előrejelzése és a kísérleti eredmény közötti eltérés predikciós hiba vagy kísérleti hiba volt.
A teljes képhez tartozik, hogy egyelőre a DeepMind szoftvere sem tévedhetetlen: az előzetesen mágneses magrezonancia spektroszkópiával meghatározott struktúrákat például rosszul jelzi, és azokat a proteinkomplexumokban lévő egyedi struktúrákat is nehezen modellezi, ahol a többi fehérjével való interakció eltorzítja az alakzatokat.
Kapcsolódó cikkek a Qubiten:
A mesterséges intelligencia végre feltárhatja a fehérjék szerkezetének rejtélyeit
Egyre közelebb kerülünk ahhoz, hogy pontosan meg tudjuk jósolni a fehérjék szerkezetét, ami forradalmasíthatja a biokémiát, és közelebb vihet súlyos betegségek gyógyításához is.
Szintet lépett a mesterséges intelligencia: először tanult meg sakkozni egy AI emberi segítség nélkül
A Google-féle AlphaZero 9 óra alatt, a nulláról tanult meg játszani, majd legyőzte az emberi képességeken már rég túllépett gépi sakkvilágbajnokot. Ráadásul nem monoton másolással, hanem kreatív, emberire emlékeztető lépésekkel.
500 milliószor bújócskáztak egymással mesterséges intelligenciák, hogy szimulálják az evolúciót
Az eszközhasználat és a csapatjáték előnyeire is magától jött rá a mesterséges intelligencia. Az OpenAI kutatói szerint ez fontos mérföldkő a virtuális evolúcióban.