Rohamosan közeleg a nap, amikor már a mesterséges intelligencia mondja meg, mikor lesz eső

2023.12.15. · tudomány

Egyre nehezebb követni az áttörőnek kikiáltott mesterséges intelligencia (AI) modellek áradatát, és csak ritkán látunk bele abba, hogy melyek azok a területek, ahol ezek tényleg forradalmi előrelépésekhez vezetnek. Miután júliusban két, minden korábbinál ígéretesebb időjárás-előrejelző algoritmusról is írtunk, a Google DeepMind novemberben bemutatta a GraphCastot, ami a cég szerint már a világ legjobb hagyományos időjárás-előrejelző modelljével vetekszik.

Remi Lam és kollégái a Science folyóiratban közölt tanulmányukban azzal a rendszerrel hasonlították össze a GraphCastot, amelyik a legprecízebb globális időjárás-előrejelzést adja középtávon – ezt a Középtávú Időjárás-előrejelzések Európai Központja (ECMWF) működteti. A GitHubról letölthető, gépi tanuláson alapuló algoritmus a kutatók által meghatározott tesztek túlnyomó többségén megelőzte a fizikai modellt, miközben sokkal gyorsabban és kisebb számítási igénnyel generálta le az előrejelzést.

De mekkora előrelépést jelent valójában a GraphCast, milyen korlátai vannak a numerikus előrejelző modellekhez képest, és meddig kell várni, amíg a hasonló algoritmusokat a napi előrejelzési gyakorlatban is elkezdik használni? Abban, hogy tisztábban lássunk ezekben a kérdésekben, Szépszó Gabriella, az Országos Meteorológiai Szolgálat (OMSZ) Modellezési Osztályának vezetője volt a Qubit segítségére, aki korábban két évig dolgozott az ECMWF-nél.

A meteorológus szerint ha ezeknek a gépi tanulási algoritmusoknak sikerül megtartaniuk az időelőnyüket, akkor a következő években a rutinszerű előrejelzésben is elterjedhetnek. „Viszont a fejlesztésben és kutatásban, ahol nem kell sürgető időkényszerrel küzdeni, továbbra is döntő szerepük lesz a fizikai modelleknek, mert minden gépi tanulásos módszer alapja a tréningadatbázis, például a reanalízis, amit fizikai modellekkel állítanak elő” – írta válaszában a kutató.

Az ECMWF globális időjárás előrejelzéseit készítő bolognai szuperszámítógép
photo_camera Az ECMWF globális időjárás előrejelzéseit generáló bolognai szuperszámítógép Fotó: ECMWF

Tényleg jobb, mint az európai numerikus modell?

A DeepMind szakemberei az 1979 és 2017 közötti 39 év időjárási adatain tanították a GraphCastot, amit az ECMWF ERA5 reanalíziséből nyertek. A légköri folyamatokról történeti információkat nyújtó reanalízisek a tréningadatok biztosítása mellett a klímaváltozás nyomon követéséhez is kulcsfontosságúak. Szeptemberben például a Japán Meteorológiai Hivatal JRA-55 reanalízisének segítségével tudták először megállapítani, hogy a korábbi évtizedekhez képest mennyire kiugróan magas a havi globális átlaghőmérséklet – ezt korábban Zeke Hausfather amerikai éghajlatkutató magyarázta el a Qubitnek.

A GraphCast a DeepMind kutatói szerint precízebb, mint az ECMWF nagy felbontású numerikus előrejelzési rendszere (HRES), amely 10 napos globális előrejelzést ad 0,1 fokos szélességi és hosszúsági felbontással. Hogy ez mennyire jelent valódi áttörést? Szépszó szerint „nehéz csak a bemutatott mérőszámok alapján megítélni a [GraphCast által] generált előrejelzések értékét”, mivel azok a területi különbségekre nem mutatnak rá, míg a teljesítményének összehasonlítása nem közvetlen mérésekkel történik.

link Forrás

A meteorológus szerint ugyan már ezek, a tanulmányban ismertetett statisztikák is tükrözik az előrejelzés minőségét, de még jobb lenne, ha a napi előrejelzési gyakorlatban is rutinszerűen figyelemmel követnék a gépi tanulási algoritmusok teljesítményét. Ezáltal a szakembereknek arról is lenne benyomásuk, hogy a modellek mennyire képesek a légkör fizikai folyamatait leírni. A szakértő szerint már próbálkoznak azzal, hogy az algoritmusokkal esettanulmányokat végeznek, ami komoly lépés lehet ebbe az irányba.

De miben tér el a GraphCast a nyáron bemutatott, egyhetes globális előrejelzést előállító Pangu-Weather algoritmushoz képest? A kettő összehasonlítható az ECMWF weboldalán elérhető, néhány paraméterre elkészített előrejelzésekkel, amelyek alapján „a Pangu-Weather előrejelzései simábbak, mint a GraphCastéi, annak ellenére, hogy a felbontásuk megegyezik” – írta Szépszó. Ez szerinte annak lehet az eredménye, hogy a Pangu-Weathernél az előrejelzési időtávokat az 1, 3, 6 és 24 órás időtávokra tanított előrejelzésekből teszik össze, ami elsimítja a mezőket, míg a GraphCastnál 6 órás lépésekben generálják az előrejelzést.

Eljött a gép tanulási algoritmusok ideje

A meteorológus azt állítja, most az első vonalbeli felhasználókat, a napi prognózisok készítőit kellene arra motiválni, hogy elkezdjék használni a GraphCast és más hasonló algoritmusok előrejelzéseit, és összevessék azokat a fizikai modelleken alapuló előrejelzésekkel. Ez ma még kevés szolgáltatónál történik meg. „Ha az előrejelző kollégák próbáját kiállják ezek a módszerek, akkor a napi előrejelzési gyakorlatban lehet szerepük” – írta a meteorológus.

A gépi tanulásos módszereknek azonban korlátaik is vannak – Szépszó szerint például az, hogy egy analízismezőből indítják az előrejelzést, amit hagyományos fizikai modellek segítségével állítanak elő. Így hiába gyorsak a gépi tanulási technikák, azt az időtávot mindenképpen meg kell várni a futtatásukkal, amíg a mérések beérkeznek a központi rendszerbe, és a fizikai modell az úgynevezett adatasszimiláció segítségével előállítja a kezdeti mezőt. Azt, hogy az adatasszimiláció megspórolható-e gépi tanulásos módszerekkel, az ECMWF a következő években egy ambiciózus program keretében vizsgálja.

A GraphCast elsődleges feladata jelenleg a determinisztikus előrejelzés, miközben az ECMWF integrált előrejelzési rendszerének (IFS) másik ágával, a valószínűségi előrejelzéseket generáló, úgynevezett ensemble előrejelzési rendszerrel (ENS) nem képes versenyezni. Utóbbi a DeepMind szerint különösen az extrém időjárási események valószínűségének becsléséhez fontos eszköz, valamint a hosszabb távú predikciók pontosságát biztosítja.

Szépszó azt állítja, az ENS-nél idővel le tudják majd küzdeni a modellek jelenlegi akadályait, és hatékonyan elő tudnak állítani olyan predikciókat, ami az egyedi előrejelzésekhez hasonló minőséget produkál. Az ugyanakkor szerinte továbbra is kérdés, hogy ezek az algoritmusok ki tudják-e váltani a globális előrejelzések egy másik fő felhasználását, amikor azok a regionális előrejelzésekhez – mint amilyeneket az OMSZ is készít – határfeltételként szolgálnak.

Ez ugyanis elengedhetetlen az ilyen földrajzilag korlátos, például a közép-európai régiót lefedő numerikus modellek esetén. Szépszó szerint a határfeltételekhez több meteorológiai változó 60-100 modellszinten történő előállítására van szükség, olyan módon, hogy a változók fizikailag konzisztens állapotot írjanak le. Az is ismert, hogy ezeknek a módszereknek a számításigénye a változók számával gyorsan nő.

Szépszó szerint vannak alkalmazások, ahol a GraphCasttal és más gépi tanulásos módszerekkel készülő előrejelzések jó alternatívát jelenthetnek. Ezek általában olyanok, ahol fontos, hogy az előrejelzés gyakran frissüljön, abból csak néhány változót használnak fel (például átlaghőmérséklet vagy a várható csapadék halmazállapota), és nincs szükségük a teljes háromdimenziós folyamat időbeli fejlődésének részletes ismeretére.

Ilyen például a naperőművek termelésbecslése, ahol a meteorológiai adatokból csak az érdekes, hogy mennyi lesz a Napból érkező közvetlen sugárzás, valamint az égbolt minden részéről érkező szórt sugárzás összege, vagyis a globálsugárzás. A kutató szerint ugyanígy bevethetők lehetnek az energiaszektorban a fogyasztás előzetes becsléséhez, amihez csak az átlaghőmérséklet és esetleg a napi minimum és maximum hőmérséklet ismeretére van szükség, vagy a közúti és vasúti közlekedési szektorban, ahol télen elsősorban az az érdekes, hogy milyen halmazállapotú lesz a várható csapadék. Az, hogy a GraphCast, a Pangu-Weather és még fejlettebb utódaik milyen más előrejelzési területeken játszhatnak még fontos szerepet, a következő években derül majd ki.