Tietotekniikan menetelmien kehittyessä myös sään ja ilmaston tutkimus ottaa harppauksia eteenpäin. Mitä tarjottavaa moderneilla tekoäly- ja koneoppimismenetelmillä on ilmakehätutkijoille?

Nykyaikaisessa sään, ilmaston ja ilmastonmuutoksen vaikutustutkimuksessa rakennetaan yhä hienostuneempia tilastollisia malleja monimutkaisten vuorovaikutussuhteiden tai niiden vaikutusten kuvaamiseksi esimerkiksi luonnon ja yhteiskunnan välillä. Vuorovaikutukset voivat olla todellisuudessa yksi- tai kaksisuuntaisia ja varsin usein verkottuneita, mutta yleensä mallinnuksessa tai viimeistään tuloksia raportoitaessa tarkastelu rajataan yhteen ilmiöön ja vaikutussuuntaan kerrallaan.

Liukkauden aiheuttamat jalankulkuonnettomuudet, myrskyjen aiheuttamat puustovahingot sekä sateisuuden määrittelemät satotasot ovat esimerkkejä voimakkaasti ilmakehän ilmiöistä riippuvista yhteiskunnallisista tutkimuskohteista. Useimpia tällaisia kohteita voidaan tutkia ja ennustaa tekoälyn avulla muutaman tunnin lähihetkiennusteiden aikaskaaloista aina vuosikymmenten ja  -satojen ennustepituuksiin asti. Koneoppimisesta ja laajemmin tekoälystä puhutaan silloin, kun mallit ja algoritmit osaavat itse päätellä opetusaineistoista sellaisia ominaisuuksia, jotka ovat oleellisia ja tarpeellisia jonkin tietyn ongelman ratkaisemiseksi. Ominaisuuksien tunnistamisen lisäksi koneoppimismalli oppii painottamaan näitä ominaisuuksia niiden tärkeyden mukaan, mikä tarkentaa myöhemmässä vaiheessa mallilla tehtäviä vaikutusennusteita.

Lähes aina tutkittavaan ilmiöön vaikuttaa samanaikaisesti useita erilaisia tekijöitä, joista osa on tärkeämpiä kuin toiset. Tekijöiden yhteisvaikutuksen summana saadaan lopullinen mallitulos eli ennuste. Mitä enemmän harjoitteluaineistoa mallille voidaan tarjota koulutusvaiheessa, sitä paremmin ja luotettavammin se oppii aineistossa piilevät ominaisuudet, vuorovaikutussuhteet ja syy-yhteydet, ja sitä tarkempia ennusteita mallilla voidaan myöhemmin tehdä. Vuosikymmeniä pitkät, hyvälaatuiset aikasarjat historiallisista vaikutusaineistoista kuten satotasoista, puustovahingoista sekä jalankulkuonnettomuuksista ovat onnistuneen koneoppimismallinnuksen välttämätön lähtökohta ja edellytys.

Vaikutusaineistojen lisäksi tarvitaan laadukkaita sää- ja ilmastoaineistoja

Historiallisten vaikutusaineistojen ohella tarvitaan tarkkoja historiallisia ilmakehäaineistoja, joita on nykyään runsaasti saatavilla tutkimuskäyttöön. Tällaiset ilmastoaineistot ovat hyvin monimutkaisia ja yksityiskohtaisia kokonaisuuksia. Ne kattavat Maapallon jokaisen paikan valtamerten syvyyksistä aina ilmakehän ylärajalle asti. Jokaisesta kuvatusta pisteestä on saatavilla kymmeniä tai peräti satoja erilaisia parametreja, jotka kuvaavat ilmakehän ja valtamerien tilaa ajan ja paikan suhteen. Tällaisen aineiston avulla voidaan suoraan tai yksinkertaisella analyysillä vastata sellaisiin kysymyksiin, kuten mikä oli Kapkaupungin lämpötila toukokuun viidentenä 1949, paljonko merijäätä oli Pohjoisella Jäämerellä kesällä 1982, tai mikä otsonitilanne oli stratosfäärissä 2006.

Monimutkaisempien ja yhteiskunnallisesti merkittävien tutkimuskysymysten selvittäminen näiden aineistojen perusteella on kuitenkin huomattavasti vaikeampi ongelma. Aineistot sisältävät valtavasti informaatiota, jonka rajaaminen, käsitteleminen, lajitteleminen ja painottaminen mekaanisena käsityönä optimaalisella tavalla kutakin vaikutustukimuskysymystä varten kävisi hyvin nopeasti ylivoimaiseksi. Juuri tällaisia ongelmia varten automaattisia rutiineja, aineistonlouhintatekniikoita ja tekoälysovelluksia on kehitetty.

Koneoppimismallin opettaminen tarvitsee tehdä yleensä vain kerran, jonka jälkeen sitä voidaan käyttää monenlaisten ongelmien käsittelemisessä. Se voidaan esimerkiksi komentaa tutkimaan sääennusteita, jolloin sen tulokset voidaan tulkita sääaikaskaalan vaikutusennusteina esimerkiksi jalankulkuonnettomuuksille. Vastaavasti sen avulla voidaan tutkia ilmastomallien tuloksia, jolloin saadaan arvioita ilmastonmuutosten vaikutuksista yhteiskuntaan. Ilmiötasolla puolestaan voidaan tutkia, mitkä tekijät vaikuttavat kulloisenkin tutkimuskohteen tuloksiin yleisesti tai jossain tietyssä erityistilanteessa. Tällaista tutkimusta kutsutaan attribuutioanalyysiksi, ja sen merkitys esimerkiksi ilmastonmuutoksen vaikutusmekanismien kuvaamisessa on kasvamassa.

Vaikutustutkimus tulee koko ajan tarkemmaksi koneoppimismallien kehittyessä monipuolisemmiksi ja tehokkaammiksi. Tekoälyn avulla on mahdollista löytää yllättäviä vaikutusmekanismeja ja syy-yhteyksiä, joiden olemassaolo jäisi muuten helposti hämärän peittoon. Lisäksi menetelmät vapauttavat tutkijat ja asiantuntijat monista puuduttavista rutiinitehtävistä, jolloin aikaa jää enemmän käytettäväksi oleellisten tutkimuskysymysten pohtimiseen ja luovuuteen.

Teksti: Matti Kämäräinen
Kuva: Sami Ahonen

Lähdeviite
DOI: 10.35614/ISSN-2341-6408-IK-2022-02-02