Magyar fizikusok mesterséges neuronhálózattal erednek a rejtélyes sötét anyag nyomába
Az ELTE Komplex Rendszerek Fizikája Tanszékének kutatói olyan mélytanulási (deep learning) hálózatot alakítottak ki, amellyel az eddigieknél sokkal precízebben tudják meghatározni az úgynevezett kozmológiai paramétereket az univerzum – gravitációs lencsézést ábrázoló – háromdimenziós térképekből. A Nature Astronomy folyóiratban publikált tanulmány olyan módszert mutat be, amit egy mesterséges neuronhálózattól lestek el a magyar fizikusok.
A sötét anyag nyomában
A sötét anyag és a sötét energia természetének megértése a kortárs asztrofizika egyik legfogósabb problémája – olvasható a publikációról hírt adó ELTE-közleményben. A tudomány jelenlegi állása szerint ugyanis a világegyetem anyagmérlegének csak töredékét alkotja a látszó anyag. A domináns mennyiségben előforduló sötét anyag azonban nem bocsájt ki elektromágneses sugárzást, így közvetlenül nem látható, hatása kizárólag a gravitáción keresztül jelentkezik.
Ezt az úgynevezett gyenge gravitációs lencsézés teszi mérhetővé. A módszer alapja, hogy miközben a távoli galaxisok fénye felénk közeledik, a sötét anyag sűrűbb és ritkább régiói eltérítik a fénysugarak útját, ezért a galaxisok alakját torzítottan látjuk. A jelenség ahhoz hasonlítható, mint mikor nyáron az aszfalt fölött felhevült vibráló levegőn át szemléljük a távoli tájat. Sok-sok távoli galaxis megfigyelésével az „átvilágított” sötét anyag eloszlásáról térkép készíthető.
A rejtély megfejtésére számos nagyszabású kozmológiai felmérés indult, amelyek nagy komplex adathalmazokat eredményeznek. Ilyen volt például a Sloan Digital Sky Survey, amelyben évek óta dolgoznak az ELTE-s kutatók is: a projekt galaxisok millióit észlelve megalkotta az univerzum háromdimenziós térképét. Ez a gyenge gravitációs lencsézést ábrázoló térkép rengeteg információt hordoz az univerzum történetéről, jellemzőiről, amelyek leírására a fizikusok úgynevezett kozmológiai paramétereket vezettek be.
Ezt az információt azonban nehéz kinyerni a térképekből: a kozmológiai paraméterek, mint például az anyagsűrűség vagy a korai sűrűségfluktuációk mértéke, hosszú és bonyolult fizikai folyamatokon keresztül befolyásolják a lencsézést ábrázoló térképek pontos megjelenését. Ezt a folyamatot közvetlenül nem lehet megfordítani, megoldása egy nehéz inverz probléma. A vibráló levegős hasonlattal élve ez olyan, mintha a háttérben eltorzult táj képéből kellene a hőmérsékletet, a légnyomást vagy éppen a nitrogén-oxid-légszennyezés mértékét meghatározni.
Univerzumstatisztikák
A kutatók különböző statisztikai módszerekkel próbálnak információt kinyerni. A vizsgálatok során sötétanyag-szimulációk segítségével virtuális univerzumokat hoznak létre, amelyekben sorra más és más a kozmológiai paraméterek értéke. Mindegyikben végigkövetik a fénysugarak útjait, és a torzulásokból virtuális lencsézéssel térképeket számolnak ki. Ezek statisztikai jellemzőit lehet aztán összevetni a valódi észlelésekkel, majd meghatározni az igazi világegyetem paramétereit.
A paraméterbecslés pontossága azon múlik, hogy a statisztikai módszer mennyi információt tud kivonni a térképekből. Az eddig használt kétpont-statisztikán alapuló módszerekről, pl. a legelterjedtebb és legjobban megértett teljesítmény sűrűség spektrum módszerről lehet tudni, hogy nem nyeri ki a maximális információt, de nehéz jobbat tervezni nála. Egy másik, kicsivel érzékenyebb módszer a térképeken lévő „hegyek” magasságainak hisztogramjával dolgozik. A minél pontosabb módszer azért is fontos lenne, mert annak hiányában csak – költségét tekintve is – jóval nagyobb, sokkal több galaxist érintő észlelési programmal lehet precízebb eredményt elérni.
Mélytanulás egyszerűbben
Csabai István egyetemi tanár és PhD-hallgatói más területeken már sikerrel használtak gépi tanulási módszereket. Ribli Dezső és Pataki Bálint Ármin első és második helyezést értek el az orvosbiológia aktuális kihívásait megcélzó, ezernél több kutatót megmozgató nemzetközi DREAM Challenge versenyen. Pataki Bálint olyan módszert dolgozott ki, amelyik mobil szenzorok adataiból képes a Parkinson-kór korai jeleit felismerni, Ribli Dezső pedig mammográfiai képek diagnosztikájához fejlesztett ki egy pontos eljárást.
Egy-egy modern mesterséges neuronhálózat több millió neuront és akár sok millió belső paramétert tartalmazhat. A hálózat működése az ember számára áttekinthetetlen „fekete doboz”, általánosan nehéz bebizonyítani, hogy az eddig nem látott bemenetekre vajon szintén ugyanolyan pontos választ ad-e majd, mint azokra, amelyeken tanították és tesztelték.
Annak érdekében, hogy a hálózat rejtett működését feltárják, a kutatók „belenéztek a fekete dobozba”, és egy olyan részegységet találtak, amelyik különösen fontos volt a becslés során. Megvizsgálva annak paramétereit meglepve tapasztalták, hogy az nagyon hasonlít az úgynevezett Roberts-kereszt (Roberts cross) operátorhoz, amely képfeldolgozó körökben nem ismeretlen, viszont a kozmológusok eddig nem alkalmazták azt az adatok elemzésére.
Kiderült, hogy a neuronháló milliónyi paramétere helyett önmagában ennek az operátornak a használatával felépített módszer is remekül működik: a neuronháló egy olyan új egyszerű ötletet „fedezett fel”, amelyik gyorsan, átlátható módon, stabilan használható precíz kozmológiai paraméter-becslésre.