Kedden tették közzé azt a több mint 24 ezer tanulmányt tartalmazó tudományos adatbázist, amely a COVID-19-hez kapcsolódó releváns kutatásokat fésüli egybe – adta hírül az MIT Technology Review.

A COVID-19 Nyitott Kutatás Adatbázis (CORD-19, azaz Covid-19 Open Research Dataset) peer review-val működő folyóiratok anyagaiból is merít, de olyan forrásokból is, mint bioRxiv vagy a medRxiv, ahol peer review (hozzáértő kutatók előzetes bírálata) nélküli tudományos eredmények is megjelentethetők. A tudástárba került tanulmányok a SARS-CoV-2, azaz a betegséget okozó vírus, maga a COVID-19 betegség, valamint a többi koronavírus témakörét is lefedik.

A CORD-19 az eddigi legszéleskörűbb gyűjteménye a jelenlegi járványhoz kapcsolódó szakirodalomnak, és folyamatosan frissítik, ahogy újabb és újabb tanulmányok jelennek meg. A tudományos vállalkozást a Fehér Ház tudományos-technológiai irodája kezdeményezte, és három szervezet működik benne együtt: az amerikai Nemzeti Orvosi Könyvtár (NLM) a már létező tudományos publikációkhoz nyújtott hozzáférést, a Microsoft szövegértelmező algoritmusokkal szállt be, amelyek előássák a releváns cikkeket, az Allen Institute for Artificial Intelligence (AI2) pedig egységes, kezelhető formátumba konvertálta a pdf-ben és weboldalakon fellelhető tartalmakat, illetve maga biztosított helyet az adatbázisnak Semantic Scholar nevű weboldalán.

A Semantic Scholar nevű szolgáltatást azért találták ki, hogy a tudományos közösség tagjai könnyedén böngészhessenek a szakirodalomban. A CORD-19 tartalmai már át is mentek azon az adatkinyerési és elemzési folyamaton, amellyel minden új kutatási anyagot feldolgoz az AI2. A rendszer olyan információkat hoz a felszínre, mint a szerző, a módszertan, az adatok és az idézetek, hogy megkönnyítse a kutatók dolgát, amikor egy-egy tanulmány relevanciáját értékelik. Az egyes tanulmányok közötti hasonlóságok kimutatását is mesterséges intelligenciára bízzák.

Mindez azért fontos, mert létfontosságú, hogy a tudomány mielőbb választ adjon néhány nyomasztó kérdésre az új koronavírus természetéről, és ezzel is lassítsa terjedését. Az adatbázis nemcsak összefogja a különféle tudományos munkákat, hanem algoritmusok segítségével egyszerűbben kereshetővé, könnyebben használhatóvá teszi a máris hatalmas, de még nem elégséges tudásanyagot.

A Fehér Ház tudományos-technológiai irodája közzétett egy felhívást mesterséges intelligenciával foglalkozó kutatók számára, hogy fejlesszenek ki olyan új adatbányász és szövegértelmező algoritmusokat, amelyek segítik a kutatóorvosok tájékozódását a koronavírushoz kapcsolódó infomációrengetegben.

A CORD-19 adatbázis itt elérhető.

