Fél évszázados problémát oldott meg, egy csapásra forradalmasíthatja a biológiát a DeepMind algoritmusa
Óriási lépést tett a DeepMind mesterséges intelligenciára törekvő, mélytanuló algoritmusa a biológia egyik legnagyobb kihívásának megoldása felé. A Critical Assessment of Structure Prediction (CASP) nevű, fehérje-alakzatok kialakulását előre jelző, több hónapig tartó verseny keretében a Google tulajdonában álló angol cég AlphaFold szoftvere mintegy száz másik csapatot legyőzve az esetek kétharmadában hajszálpontosan jelezte előre a rendelkezésre álló aminosav-szekvenciákból a fehérjék alakzatát, amely meghatározza azok funkcióját.
A Nature hétfői cikke szerint a november 30-án közzétett eredmény rendkívüli módon felgyorsítja azt a folyamatot, amelynek során megértjük a sejtek építőelemeit, és nagy mértékben felgyorsítja a gyógyszerfejlesztést. A DeepMind a Guardiannek úgy nyilatkozott, hogy több tudóscsoporttal már elkezdtek dolgozni a malária, az álomkór és a leishmaniasis kórokozóinak megértésén.
John Moult, a Marylandi Egyetem bioinformatikusa, aki 1994-ben hozta létre a proteinolimpiának is nevezett CASP versenyt a fehérjealakzatok kialakulásának pontosabb predikciójához rendelkezésre álló számítástechnikai módszerek fejlesztésére, úgy nyilatkozott, ezzel bizonyos értelemben ez a probléma megoldódott.
Fél órán belül megoldotta, amihez a kutatóknak egy évtized sem volt elég
A 2010-ben alapított, a Google által 2014-ben felvásárolt londoni székhelyű DeepMindot leginkább a sakkban, a góban vagy a Starcraftban elért eredményei miatt ismeri a nagyközönség, bár ezeket valójában arra használja a cég, hogy a játékokon felnőtt algoritmusokat később ráeresszék az emberiség megoldandó problémáira. Az AlphaFold szoftver már a két évvel ezelőtti CASP kihíváson is az első helyen végzett, idén azonban már annyival jobban teljesített minden más csapatnál, hogy néhány tudós egyenesen azt gondolja, forradalmat hozhat a biológiába. Andrei Lupas, a német Max Planck Fejlődésbiológiai Intézet evolúcióbiológusa szerint az AlphaFold gyakorlatilag az összes tudományterületen változást hoz az orvostudománytól a kutatáson át a biomérnöki munkáig. Lupasnak és csapatának az AlphaFold fél órán belül segített megtalálni azt a fehérjestruktúrát, amellyel a laboratórium már egy évtizede nem tudott megbirkózni.
A CASP versenyen az AlphaFold struktúra-előrejelzéseit egyes esetekben lehetetlen volt megkülönböztetni az eddig bevett módszerként használt kísérleti metódusoktól, mint amilyen a röntgenkrisztallográfia és az utóbbi években bemutatott krio-elektronmikroszkópia. Bár az algoritmus egyelőre nem iktatja ki ezeket a munkaigényes és drága módszereket, már most lehetővé teszi, hogy a kutatók újszerű módon vizsgálják a különböző organizmusokat.
Janet Thornton, az egyesült királyságbeli Hinxton Európai Bioinformatikai Intézet-Európai Molekuláris Biológiai Laboratórium strukturális biológusa azt mondta: nem gondolta volna, hogy ezt a problémát még az ő életében megoldják. Reméli, hogy a megközelítés segíti majd, hogy közelebb jussanak az emberi genomban lévő több ezernyi fehérje funkciójának felderítéséhez és a betegséget okozó génvariánsok megértéséhez.
Molekuláris origami
A sejtbiológia egyik axiómája, hogy a szerkezet meghatározza a fehérje funkcióját. Az élet építőelemeit jelentő fehérjék felelnek a sejten belüli történések legnagyobb részéért. Működésüket és feladatukat, például azt, hogy miként kontrollálja a vérben a cukorszintet az inzulin, vagy hogyan küzdik le az antitestek a koronavírust, térbeli alakzatuk határozza meg,
Míg a kutatók mára több mint 200 millió fehérjét azonosítottak, csupán töredékükhöz sikerült fehérjeszerkezetet társítani. Ezek megtalálása évtizedek óta fáradságos kísérleti módszerekkel zajlik. Az 1950-es évektől a röntgensugarakat használó krisztallográfiai módszerrel határoztak meg teljes fehérjeszerkezeteket. Ennek lényege, hogy a kristályosított fehérjéket röntgensugarak hatósugarába helyezték, és a fénytörés megmutatta a fehérjéket alkotó atomok térkoordinátáit. Az elmúlt évtizedben ezt a módszert váltotta fel sok szerkezeti biológiával foglalkozó laborban a krio-elektronmikroszkópia.
A tudományt régóta foglalkoztatja a kérdés, hogy miként alakítják ki a protein végleges formáját a fehérjék alkotóelemei, a különféle aminosavak láncolatai. Ennek felderítésére már az 1980-as években elkezdtek számítógépeket alkalmazni, amelyek azonban kifejezetten rosszul teljesítettek. A publikált módszerek egyszerűen nem működtek, ha más tudósok más fehérjékre alkalmazták őket. Ezek javítására indította Moult és csapata a CASP versenyeket, ahol a résztvevő csapatok olyan fehérjék szerkezetét igyekeznek előre jelezni, amelyeket kísérleti módszerekkel már feltérképeztek, de a struktúrát nem hozták nyilvánosságra. A proteinolimpia jó alkalom arra, hogy a gyakorlatban szerezzenek bizonyosságot arról, melyik módszer válik be, és melyik nem.
Hogyan működik az AlphaFold?
A molekuláris origami megtanításához a DeepMind egy 170 ezer fehérjeszekvenciát és szerkezetüket tartalmazó adatbázisra engedte rá az algoritmusait, és az AlphaFold néhány hét alatt kiismerte magát a fehérjeszerkezetek világában. Ezt a tanulási folyamatot követi a valódi problémák megoldása.
A szoftver első változata a neurális hálókon alapuló mélytanulás módszerével igyekezett előre jelezni a fehérjékben lévő aminosavpárok egymástól való távolságát, vagyis kétdimenziós szerkezetét, strukturális és genetikai adatok alapján. Második lépésben a program a rendelkezésre álló információk alapján olyan konszenzusos modellt alkotott, amihez már nincs szükség mesterséges intelligenciára - mondta a projektet vezető John Jumper, a DeepMind munkatársa.
A csapat ezt a módszert igyekezett továbbfejleszteni, de falba ütközött, úgyhogy kénytelenek voltak irányt váltani - mondta Jumper. A DeepMind ezért olyan neurális hálót épített, amelybe a fehérjék végleges szerkezetének kialakulását meghatározó fizikai és geometriai korlátokra vonatkozó információit is beemelte. Ezután nehezebb feladatot adtak neki: az aminosavak közötti kapcsolat előrejelzése helyett a hálózatnak egyből a célfehérje aminosav-szekvenciájának végleges szerkezetét kell megjósolnia.
Tudósokat lenyűgöző pontosság
A CASP versenyeken a közel száz célfehérjét vagy fehérjerészt fokozatosan teszik elérhetővé a csapatok számára, akik több héten keresztül dolgoznak rajtuk, amíg szerkezet-előrejelzéseiket benyújtják a zsűrinek. Az anonim módon beadott eredményeket ezután egy független tudóscsoport értékeli annak alapján, hogy mennyire hasonlít az előre jelzett fehérje a kísérleti módszerekkel meghatározott fehérjéhez.
Elképesztő pontosságával az AlphaFold számos predikciója kiemelkedett a többi közül. A mérsékelten nehéz feladatnak számító célfehérjék esetén más csapatok legjobb teljesítménye 100-ból 75 pont körüli volt, míg az AlphaFold általában 90 pontot ért el, és előrejelzései kétharmadának minősége a kísérleti módszerekkel kialakított szerkezetekével vetekedett. Néhány esetben nem is volt világos, hogy az AlphaFold előrejelzése és a kísérleti eredmény közötti eltérés predikciós hiba vagy kísérleti hiba volt.
A teljes képhez tartozik, hogy egyelőre a DeepMind szoftvere sem tévedhetetlen: az előzetesen mágneses magrezonancia spektroszkópiával meghatározott struktúrákat például rosszul jelzi, és azokat a proteinkomplexumokban lévő egyedi struktúrákat is nehezen modellezi, ahol a többi fehérjével való interakció eltorzítja az alakzatokat.
Kapcsolódó cikkek a Qubiten: