Tussen Regen en Sneeuw: Machine Learning Ontdekt Negen Neerslagtypes
Tijdens een sneeuwstorm in Marquette, Michigan, heeft een door NASA ontwikkelde Precipitation Imaging Package (PIP) een weersbestendige, hogesnelheidscamera en een fel licht gebruikt om neerslag vast te leggen die door het gezichtsveld van de camera valt. De gegevens die hier en op andere locaties in de Verenigde Staten, Canada en Europa zijn verzameld, zijn bedoeld om weers- en klimaatvoorspellingen te verbeteren, nu de variabiliteit en intensiteit van neerslag afwijken van eerdere patronen.
In onderzoek dat de weersvoorspelling en de veiligheid tijdens het rijden in de winter kan verbeteren, heeft een studie geleid door de Universiteit van Michigan negen verschillende neerslagtypen onderscheiden—variëteiten van regen, sneeuw en mengfase (bijvoorbeeld ijzel)—met behulp van ongecontroleerd machine learning en bijna tien jaar aan gegevens van hogesnelheidscamera’s. Het onderzoek is gepubliceerd in Science Advances.
Regen en sneeuw zijn bij temperaturen boven en onder het vriespunt (tussen -3°C en 5°C) even waarschijnlijk, wat het moeilijk maakt om nauwkeurige voorspellingen te doen. Deze studie maakt deel uit van een NASA-inspanning om observaties mogelijk te maken die de weersmodellen kunnen verbeteren. “Op korte termijn kan betere voorspelling mensen helpen om hun dagelijkse woon-werkverkeer aan te passen of zich voor te bereiden op grote evenementen zoals overstromingen of een ijzelstorm. Op langere termijn kan het helpen voorspellen hoe de timing van sneeuwbedekking of afvoer de beschikbaarheid van zoet water voor een regio zal veranderen,” zei Claire Pettersen, assistent professor in klimaat- en ruimtewetenschappen en engineering aan U-M.
De onderzoekers gebruikten statistische technieken en machine learning om de onderliggende factoren te identificeren die neerslag onderscheiden en de gegevens daarop te sorteren. Hun classificatiesysteem omvat twee soorten regen, twee soorten sneeuw en vijf unieke mengsels:
- Motregen – lichte, constante regenval
- Hevige regenval – intense regenval met talloze kleine druppels
- Lichte regen-naar-mengfase overgang – lichte ijzel met dichte ijsdeeltjes
- Hevige regen-naar-mengfase overgang – intense ijzel met dichte ijsdeeltjes
- Lichte mengfase – een laag volume van slushachtige, gedeeltelijk bevroren deeltjes
- Hevige mengfase – een hoog volume van slushachtige, gedeeltelijk bevroren deeltjes
- Hevige sneeuw-naar-mengfase overgang – grote sneeuwvlokken en aggregaatdeeltjes
- Lichte sneeuwval – lichte, luchtige sneeuwval
- Hevige sneeuwval – een intense, zware sneeuwstorm
Het voorspellen van de fase—vast of vloeibaar—van neerslag is vandaag de dag om verschillende redenen uitdagend. Temperatuurwaarden tussen -3°C (26,6°F) en 5°C (41°F) kunnen zowel sneeuw als regen met gelijke waarschijnlijkheid produceren. Weersmodellen benaderen de complexe microfysica die zich in wolken afspeelt, wat fouten introduceert. En satellieten, die weersystemen vanuit de ruimte volgen, zijn gebaseerd op observaties van neerslag uit veldcampagnes die mogelijk niet de huidige omstandigheden weerspiegelen.
Om de gegevens die als basis dienen voor weersmodellen uit te breiden en bij te werken, heeft NASA een gespecialiseerd camerasysteem ontwikkeld, de Precipitation Imaging Package (PIP), en dit op zeven locaties in de Verenigde Staten, Canada en Europa ingezet. Het instrument, een videodisdrometer, gebruikt een weersbestendige, hogesnelheidscamera en een fel licht om neerslag vast te leggen die door het gezichtsveld van de camera valt. De metingen van de deeltjesgrootte, grootteverdeling, dichtheid, concentratie en val snelheden helpen om sneeuw en regen te onderscheiden.
In deze studie maakten de onderzoekers gebruik van PIP-gegevens die continu gedurende negen jaar op die zeven locaties zijn verzameld, wat resulteerde in 1,5 miljoen metingen van deeltjes op minuutbasis. Ze vulden dit aan met metingen van weerstations op het oppervlak voor een volledig beeld van de omgevingsomstandigheden, waaronder temperatuur, relatieve luchtvochtigheid, dauwpunt, druk en windsnelheid.
Om de structuur van deze enorme dataset te begrijpen, heeft het onderzoeksteam dimensionaliteitsreductie toegepast—een statistische techniek die gegevens met veel variabelen vereenvoudigt om onderliggende patronen te begrijpen. Van de twee geteste modellen overtrof een niet-lineaire methode, die indirecte of voorwaardelijke relaties tussen variabelen mogelijk maakt, een conventionele lineaire methode die directe relaties vereist.
Bij vergelijking met onafhankelijke weersradargegevens uit Marquette, Michigan, volgde de niet-lineaire methode neerslagovergangen die overeenkwamen met radarobservaties, terwijl het onduidelijke gevallen met 36% verminderde in vergelijking met de lineaire methode. “Neerslagprocessen zijn zeer niet-lineair. Veel factoren beïnvloeden neerslag terwijl deze valt, wat van invloed is op wat we aan het oppervlak ervaren,” zei Pettersen.
De niet-lineaire methode, genaamd UMAP (Uniform Manifold Approximation and Projection), reduceerde de dimensionaliteit met 75%, waarbij drie belangrijke factoren werden geïdentificeerd die neerslag onderscheiden: fase, intensiteit en deeltjeskenmerken. Deze factoren hielpen bij het identificeren en definiëren van deze verschillende neerslagtypen. Belangrijk is dat UMAP ook paden tussen typen benadrukt, wat een dieper begrip biedt van overgangen zoals van hevige regen naar ijzel.
In een poging om hun resultaten breed te delen, biedt het onderzoeksteam een interactieve plot aan om de gegevens te bekijken en een interface voor het publiek zodat iedereen hun classificatiesysteem kan uitproberen. Zonder voorafgaande kennis van computerprogrammering kunnen gebruikers klimaatvariabelen invoeren die zij beschikbaar hebben en een kansverdeling ontvangen van hoe de klasse van neerslag eruit zal zien. “We zijn enthousiast om te zien hoe andere mensen dit zullen gebruiken en hopen dat het enige voordelen biedt voor de modelleer gemeenschap via de interface en de lookup-tabel die we hier hebben gebouwd,” zei Fraser King, een onderzoeksmedewerker van klimaat- en ruimtewetenschappen en engineering aan U-M en de hoofdauteur van de studie.
De gegevens zijn beschikbaar op Deep Blue Data.
