A mesterséges intelligencia gőzerővel keresi a vakcinát a koronavírus ellen

Nincsen jövőnk tudomány nélkül, nincsen Qubit nélkületek. Támogasd a munkánkat!

Egy vírusellenes vakcina kifejlesztése éveket, sőt évtizedeket vehet igénybe, a mesterséges intelligencia azonban jelentősen felgyorsítja ezt a folyamatot, sőt abban is segíthet, hogy idővel a tudomány legégetőbb kérdései is megoldódjanak: az egyre ütőképesebbé váló számítógépes módszerek segítségével a kutatók már egy hatékony HIV-vírus elleni vakcinát és egy több évre ellenállóképességet garantáló, influenza elleni védőoltást is kilátásba helyeztek. Egészen tavaly decemberig, a SARS-CoV-2 vírus felbukkanásáig. Jelenleg ugyanis a prioritás természetesen a koronavírus elleni vakcina kifejlesztése, minden más projekt háttérbe szorult: a WHO legfrissebb, október 29-i információi szerint jelenleg 45 vakcinajelölt a klinikai tesztelés fázisában, további 156 pedig a preklinikai fázisban tart, és számos kutató, így az MTA szerint is a védőoltás 2021 nyarán válhat elérhetővé.

Az IEEE (Institute of Electrical and Electronics Engineers) körképe szerint a vakcinafejlesztés rekordját eddig a mumpsz elleni védőoltás tartja, amelynek a begyűjtött vírusmintától a piacra dobott termékig mindössze négy évig tartott a kifejlesztése, átlagosan azonban egy védőoltás biztonságos kikísérletezése 10-15 évet is felölelhet. Az, hogy a SARS-CoV-2 vírus esetében a vakcina megjelenésének becsült ideje a genomszekvenálástól, vagyis 2020 januárjától kezdődően 12-18 hónap, javarészt a szuperszámítógépeknek és az azokon futó okos algoritmusoknak köszönhető.

Algoritmikus katalizátorok

A folyamat hagyományosan azért ilyen hosszú, mert a tudósok igyekeznek minden eszközzel garantálni, hogy a kifejlesztett oltóanyag hatékony és biztonságos legyen, és hogy ismerjék az összes potenciális mellékhatását. Ehhez az első, preklinikai szakaszban a kutatóknak meg kell érteniük a vírus működését, és ha ez sikerült, akkor olyan természetes vagy szintetikus antigéneket – immunválaszt kiváltó ellenanyagokat – kell keresniük, amelyek ugyanolyan választ váltanak ki, mint maga a vírus vagy a baktérium. Önmagában ez a kutatási fázis akár négy évig is eltarthat.

Ezt követi a hónapokig, akár több évig is elhúzódó tesztelési időszak.  A nulladik lépésben állatokon mérik fel egy-egy oltóanyag hatékonyságát és biztonságosságát, majd az első fázisban néhány hónapon keresztül általában 20-80 emberen tesztelik a vakcina által előidézett immunválaszt, és azt, hogy mennyire biztonságos. Emellett már igyekeznek meghatározni a leghatásosabb dózist is. A második és harmadik fázisban tesztalanyok százain, majd ezrein tesztelik le a vakcina hatását, és ez a szakasz még az Oxford/Astra Zeneca koronavírus-tesztelés leállításához hasonló, nem várt eseményeket leszámítva is évekig tarthat.

Bár a gépi tanulással fejlődő algoritmusok és számítógépes elemzések nem válthatják ki a vakcinafejlesztés embereken történő tesztelését, abban segítenek a kutatóknak, hogy gyorsabban megérthessék a vírust és struktúráját, valamint megpróbálják előre jelezni, milyen komponensük válthat ki immunválaszt. A mesterséges intelligencia emellett segíthet a tanulmányok gyors átfésülésében és a megfelelő tesztalanyok kiválasztásában is. Az amerikai Nemzeti Egészségügyi Intézet (NIH) COVID-19 Portfolio nevű oldala, amely a koronavírussal kapcsolatos tanulmányokat listázza, már most több mint 28 ezer cikket tartalmaz. Ezt egyetlen kutató sem tudja egymaga elolvasni, viszont az utóbbi időben számos olyan algoritmikus keresőmotort fejlesztettek le, amelyek segítik a tudósokat a számukra érdekes tanulmányok gyors megtalálásában.

A mesterséges intelligencia erőteljes katalizátor-szerepet tölthet be - mondta Suchi Saria, a Johns Hopkins Egyetem Whiting Mérnöki Iskolájának egyetemi docense és az egyetem gépi tanulással és egészségüggyel foglalkozó laboratóriumának vezetője az IEEE magazinnak. Segítenek a kutatóknak eligazodni azokban a gyakran zavaros adathalmazokban is, amelyeket korábban meg sem próbáltak feldolgozni, tette hozzá. A mesterséges intelligencia azt is lehetővé teszi a tudósoknak, hogy kiválaszthassák egy potenciális védőoltás elemeit, hogy értelmezhetővé váljanak a kísérleti adatok, és hogy nyomon követhessék a vírus genetikai mutálódását, ez pedig olyan információ, amely évekre meghatározhatja bármilyen vakcina értékét. 

Vakcinatervezés AI-módra

A modern vakcinatervezés rengeteg információt igényel a vírus természetének megértésétől az emberi immunrendszer reakciójáig. Egy 2012-es tanulmány szerint legalább 219 olyan vírus van, amelyik képes megfertőzni az emberi szervezetet; mindegyik sajátos mechanizmusokkal él és viselkedéssel bír, és emiatt természetesen saját gyógymódot igényel. Egy új patogén esetén a vakcinatervezők első kérdése, hogy a vírus melyik része lehet a leginkább immunogén, azaz melyik antigén képes a legnagyobb immunválaszt kiváltani. Egy tipikus vírus genetikai örökítőanyagból (DNS vagy RNS), valamint az azt körbevevő egy vagy több fehérjerétegből áll. A külső membránt gyakran tüskefehérjék borítják, amelyek lehetővé teszik a vírusnak, hogy a gazdasejt receptoraihoz kapcsolódjon, és belefecskendezze genetikai örökítőanyagát. Emiatt a tüskefehérjék a vakcinafejlesztés gyakori célpontjai, hiszen ha az immunrendszer olyan antitesteket termel, amelyek ezeket hatástalanítják, a vírus nem tud bejutni a sejtekbe.

Cakhogy minden egyes vírusra különféle fehérjeburkok több tízezernyi alkomponense jut, amelyeket az immunrendszer képes felismerni, és ez több tízezer különféle potenciális vakcinajelöltet jelent. A mesterséges intelligencia-alapú szoftvereknek ezen a ponton van a legnagyobb hatásuk: a gépi tanulással fejlesztett algoritmusok az ismert patogének adathalmazából kialakított tanulópályán betanítva képesek előre jelezni, hogy az immunrendszer a vírus melyik részeit fogja leginkább felismerni.

MARIA és más szárnysegédek

Ezzel az információval felvértezve az immunológusok kezelhetőbb számú potenciális vakcinajelölttel dolgozhatnak. A világjárvány első heteiben a Stanford Emberközpontú Mesterséges Intelligencia Intézetében egy csapatnyi kutató a NetMHCpan-4.0 és a MARIA nevű neurális hálókat és a DiscoTope nevű lineáris regressziós modellt használva összeállított egy listát azokról az epitópokról – az antigén azon része, amelyet az immunrendszer sejtjei felismernek, és amelyhez az ellene termelt antitest kapcsolódik azért, hogy elpusztítsa –, amelyeket egy vakcina segítségével meg lehetne célozni ahhoz, hogy immunválaszt kapjunk. A várakozásoknak megfelelően az algoritmusok leginkább a vírus tüskefehérjéjén található epitópokat ajánlottak. 

A stanfordi kutatócsoport gépi tanulással fejlődő algoritmusai az immunológiai munkát segítő maroknyi szoftver közé tartoznak. Binbin Chen, a kutatócsoport egyik tagja szerint míg a gépi tanulás korábban a vakcinafejlesztés kisebb jelentőségű segítője volt, a koronavírus megjelenésével igazi szárnysegéddé vált. Chen szerint feltétekezhető, hogy az összes gyógyszercég, amelyik vakcinát fejleszt, számítógépes elemzéssel kezdte a munkát.

Amikor a vírus felületén a kutatók azonosították az epitópot, megkezdődhet a vakcinajelölt kifejlesztése. Ha például inaktivált vírust szeretnének védőoltásként használni, kitenyésztik a vírust a laboratóriumban, hő, besugárzás vagy vegyi módszerek segítségével hatástalanítják, hogy az emberi testbe fecskendezve ne tudjon szaporodni. A kutatóknak ezután meg kell bizonyosodniuk arról, hogy a kulcsfontosságú, immunogenitással bíró komponensek nem károsodtak, mivel ezeknek sértetlennek kell lenniük ahhoz, hogy immunválasz termelődhessen. 

Vakcinajelölt három órán belül

Ahhoz, hogy a szoftverek sikeresen deríthessék fel egy vírus epitópjait, a virális fehérjék háromdimenziós szerkezetének megértésére is szükség van. Ezek a proteinek aminosavak lineáris láncaiból állnak, amelyek kompakt, szalagszerű struktúrákká alakulnak át. A vakcinafejlesztőknek a vírus külső burkán olyan célhelyeket kell találniuk, amelyek fizikailag megközelíthetőek az immunrendszer védelmi rendszere számára. A világjárvány elején a Bázeli Egyetem kutatói a Swiss-Model nevű fehérjemodellező eszközt használták arra, hogy megjósolják a SARS-CoV-2 vírus külső burkán lévő fehérjék szerkezetét. A Google tulajdonában lévő, londoni DeepMind a saját, AlphaFold nevű neurális hálóját szintén arra használta, hogy a vírus génszekvenciáját alapul véve kitalálja, hogyan fest a SARS-CoV-2 fehérjék háromdimenziós alakja. 

Az AI azonban sokkal több mindenre képes annál, mint hogy felrajzolja egy vírus fehérjéinek háromdimenziós térképét és megkeresse a felületén megcélzandó epitópokat. Számos vakcinafejlesztő használ már algoritmikus eszközöket a DNS-alapú vakcinák genetikai komponensei szintetizálására. A koronavírus elleni, harmadik fázisban tartó vakcinajelöltek egyikét gyártó, San Diegó-i Inovio Pharmaceuticals nevű cég csak egy példa közülük. Kate Broderick, az Inovio egyik kutatás-fejlesztési alelnöke az IEEE magazinnak azt mondta, a cég lelkesen várta, hogy a koronavírus genomszekvenciáját feltegyék az internetre. Amikor a kínai hatóságok január 10-én feltöltötték, az Inovio kutatói azonnal betáplálták a szekvenciát a programjukba, és az algoritmus három órán belül kidobott egy teljesen megtervezett és optimalizált, DNS-alapú vakcinajelöltet, amely 83 napon belül már a klinikai tesztelés fázisába került. Sőt, a májusban a Nature Communications folyóiratban publikált tanulmányuk szerint az oltóanyag jól teljesített az állatkísérletekben, június végén pedig az Inovio közölte, hogy a vakcina az Egyesült Államokban elvégzett első fázisú tesztek során negyven egészséges embernél immunválaszt váltott ki.

Genetikai mutációk követése és koronavírusos betegek diagnosztizálása

A kutatóknak ugyancsak kihívást jelent, hogy lépést tartsanak a vírus genetikai változásaival. Ezért egy hatásos oltóanyagot a vírus genomjának viszonylag stabil, mutációra kevéssé hajlamos régiója felhasználásával érdemes megtervezni. Az elmúlt 10 hónapban világszerte több tízezer koronavírusos betegtől származó vírusminta genomját szekvenálták és töltötték fel a németországi Global Initiative on Sharing All Influenza Data (GISAID) által indított online adattárba. Az ezeket a génszekvenciákat összehasonlító algoritmusok felfedhetik, hogy a vírus genomjának melyik szegmensei változnak gyakran, és melyek nem. Ez rendkívül hasznos információt jelent a kutatóknak.

Nem csupán a vakcinakeresést gyorsíthatja fel az AI, hanem a koronavírusos betegek diagnosztizálását is. Az okosalgoritmusokkal az egyik leginkább fejleszthető területen, a radiológiában például nemrég olyan eszközt hoztak létre, amely CT-felvételek alapján egy percen belül képes megmondani, koronavírusos-e a beteg. Ezt az Európai Bizottság támogatásával már 10 európai kórházban használják

Mostanra világszerte négymillióan töltötték le azt az Egyesült Királyságban kifejlesztett, Covid Symptom Study nevű alkalmazást, amelyben a felhasználók naponta naplózni tudják tüneteiket. Ezeket olyan algoritmusok elemzik, amelyek a temérdek összegyűlt adat alapján mára már teszt nélkül is egészen pontosan meg tudják mondani, hogy melyik felhasználó koronavírusos. A londoni King’s College kutatói arra használják ezt az óriási adatbázist, hogy tanulmányozzák, mi okozza az egyes betegeknél az eltérő tüneteket és súlyossági fokozatokat. Az pedig a napokban került nyilvánosságra, hogy az MIT kutatói olyan algoritmust fejlesztettek, amelyik a köhögés alapján képes a tünetmentes fertőzötteknél is megállapítani, hogy elkapták a koronavírust.

Az algoritmusok határai

A sikerek ellenére nem minden kutató lelkesedik a mesterséges intelligencia alkalmazásáért a vakcinafejlesztés terén. Sokan úgy vélik, hogy AI ide vagy oda, a koronavírusokkal kapcsolatos meglévő tudásbázis és a SARS-CoV-2 vírussal megkezdett kísérletek hamar megmutatták, hogy nyilvánvalóan a tüskefehérjét kell megcélozni az oltóanyaggal. Jacob Glanville, a Distributed Bio és leánycége, a Centivax alapítója szerint számos módszer van a patogének immunogenitásal bíró régióinak azonosítására, amelyekhez nincs szükség mesterséges intelligenciára. Az algoritmusoknak szerinte továbbra is be kell bizonyítaniuk, hogy jobbak az olyan egyszerűbb módszereknél, mint a szerológiai szűrés, az epitóp-feltérképezés és a strukturális biológia.

Ezen kívül a számítógépes metódusoknak is megvannak a határai: a mesterséges intelligencia nem tudja átvenni vagy felgyorsítani a vakcinafejlesztés legfontosabb és leginkább időigényes részét, a klinikai tesztelést. Amíg a virtuális modellekkel dolgozó klinikai vizsgálatok nem jutnak el egy olyan fejlettségi szintre, hogy biztonságosan kiváltsák az állatokon és embereken végzett vakcinateszteket, a védőoltások kifejlesztése több ezer tudós, egészségügyi dolgozó és tesztalany hónapokig, sőt évekig tartó közös munkája lesz. Ahogy Glanville nyilatkozta: „a számítógépek segítenek optimalizálni a siker esélyeit, de előbb-utóbb eljön az idő, amikor fel kell tűrni az ingujjat, és le kell menni a laborba”.

Kapcsolódó cikkek a Qubiten: