Machine Learning Encoder Verbetert Weersvoorspellingen en Tsunami Voorspellingen
Succesvolle testresultaten van een nieuwe machine learning (ML) techniek ontwikkeld aan Georgia Tech kunnen gemeenschappen helpen zich voor te bereiden op extreme weersomstandigheden en kustoverstromingen. Deze aanpak kan ook worden toegepast op andere modellen die voorspellen hoe natuurlijke systemen de samenleving beïnvloeden.
Ph.D. student Phillip Si en assistent-professor Peng Chen ontwikkelden Latent-EnSF, een techniek die verbetert hoe ML-modellen data assimileren om voorspellingen te doen. In experimenten met het voorspellen van het weer op middellange termijn en de voortplanting van golven in ondiep water, toonde Latent-EnSF hogere nauwkeurigheid, snellere convergentie en grotere efficiëntie aan dan bestaande methoden voor spaarzame data-assimilatie.
“We zijn momenteel betrokken bij een project dat erop gericht is om realtime informatie te bieden over extreme overstromingsgebeurtenissen in Pinellas County, Florida,” zei Si, die zich bezighoudt met computationele wetenschap en engineering (CSE). “We werken actief aan de integratie van Latent-EnSF in het systeem, wat een nauwkeurige en gesynchroniseerde modellering van natuurrampen zal vergemakkelijken. Dit initiatief is bedoeld om de paraatheid van gemeenschappen en veiligheidsmaatregelen in reactie op overstromingsrisico’s te verbeteren.”
Latent-EnSF overtrof drie vergelijkbare modellen in assimilatiesnelheid, nauwkeurigheid en efficiëntie in experimenten met golven in ondiep water. Deze tests tonen aan dat modellen betere en snellere voorspellingen van kustoverstromingsgolven, getijden en tsunami’s kunnen maken. In experimenten over middellange termijn weersvoorspelling overtrof Latent-EnSF dezelfde drie controlemodellen in nauwkeurigheid, convergentie en tijd. Bovendien toonde deze test de schaalbaarheid van Latent-EnSF aan in vergelijking met andere methoden.
Deze veelbelovende resultaten ondersteunen het gebruik van ML-modellen om klimaat, weer en andere complexe systemen te simuleren.
Traditioneel vereisen dergelijke studies het gebruik van grote, energie-intensieve supercomputers. Echter, vooruitgangen zoals Latent-EnSF maken kleinere, efficiëntere ML-modellen haalbaar voor deze doeleinden. Het team van Georgia Tech noemde deze vergelijking in hun paper. Het kost uren voor de computer van het Europese Centrum voor Middellange Termijn Weersvoorspellingen om zijn simulaties uit te voeren. Daarentegen berekende het ML-model FourCastNet dezelfde voorspelling in seconden.
“Resolutie, complexiteit en datavariëteit zullen in de toekomst blijven toenemen,” zei Chen, een assistent-professor aan de School of CSE. “Om gelijke tred te houden met deze trend, geloven we dat ML-modellen en ML-gebaseerde data-assimilatiemethoden onmisbaar zullen worden voor het bestuderen van grootschalige complexe systemen.”
Data-assimilatie is het proces waarbij modellen continu nieuwe, real-world data opnemen om voorspellingen bij te werken. Deze data is vaak spaarzaam, wat betekent dat deze beperkt, onvolledig of ongelijk verdeeld is over de tijd. Latent-EnSF bouwt voort op het Ensemble Filter Scores (EnSF) model, ontwikkeld door onderzoekers van de Florida State University en het Oak Ridge National Laboratory.
De kracht van EnSF is dat het data met veel kenmerken en onvoorspelbare relaties tussen datapunten assimileert. Echter, het integreren van spaarzame data leidt tot verloren informatie en kennislacunes in het model. Ook kunnen dergelijke grote modellen volledig stoppen met leren van kleine hoeveelheden spaarzame data.
De onderzoekers van Georgia Tech gebruiken twee variational autoencoders (VAEs) in Latent-EnSF om ML-modellen te helpen real-world data te integreren en gebruiken. De VAEs coderen spaarzame data en voorspellende modellen samen in dezelfde ruimte om data nauwkeuriger en efficiënter te assimileren.
Het integreren van modellen met nieuwe methoden, zoals Latent-EnSF, versnelt data-assimilatie. Het sneller produceren van nauwkeurige voorspellingen tijdens real-world crises kan levens en eigendommen van gemeenschappen redden.
Om Latent-EnSF met de bredere onderzoeksgemeenschap te delen, presenteerden Chen en Si hun paper op de SIAM Conferentie over Computatiewetenschap en Engineering (CSE25). De Society of Industrial and Applied Mathematics (SIAM) organiseerde CSE25, die plaatsvond van 3 tot 7 maart in Fort Worth, Texas. Chen was een van de tien faculteitsleden van de School of CSE die onderzoek presenteerden op CSE25, wat een derde van de faculteit van de School vertegenwoordigt. Latent-EnSF was een van de 15 papers van auteurs van de School of CSE en een van de 23 Georgia Tech papers die op de conferentie werden gepresenteerd.
Het duo zal Latent-EnSF ook presenteren op de komende International Conference on Learning Representations (ICLR 2025). Deze conferentie vindt plaats van 24 tot 28 april in Singapore en is een van de meest prestigieuze conferenties ter wereld die is gewijd aan onderzoek naar kunstmatige intelligentie. “We hopen de aandacht van experts en domeinwetenschappers te vestigen op het spannende gebied van ML-gebaseerde data-assimilatie door onze paper te presenteren,” zei Chen. “Ons werk biedt een nieuwe oplossing om enkele van de belangrijkste tekortkomingen in dit gebied aan te pakken voor bredere toepassingen.”