Osa 1 — Inflaatio ei ole luku vaan se on prosessi

R
Data Science
talous
inflaatio
ennustaminen
Suomen inflaation kuvailua
Published

March 4, 2026

Inflaatio on yksi seuratuimmista talousmittareista maailmassa.

Keskuspankit tekevät siitä ennusteita. Media raportoi siitä kuukausittain. Poliitikot käyttävät sitä argumenttina lähes kaikessa talouspolitiikassa.

Silti yksi asia jää lähes aina keskustelun ulkopuolelle:

Kuinka hyvin inflaatiota oikeasti pystytään ennustamaan?

Makrotaloudessa ennusteet esitetään lähes aina yksittäisinä lukuina:

“Inflaatio on ensi vuonna 2,1 %.”

Mutta todellisuudessa inflaatio ei ole deterministinen luku. Se on stokastinen prosessi, johon vaikuttavat esimerkiksi:

Siksi tässä sarjassa lähestyn inflaatiota todennäköisyysjakaumana, en yksittäisenä lukuna.

Aian ennen kuin aloitetaan rakentamaan malleja, tulee ymmärtää data. Tämä ensimmäinen osa keskittyy siihen. Toisessa osassa mennään varsinaisiin malleihin.

Data: Eurostatin HICP-indeksi

Inflaatiota mitataan monella tavalla. Tässä sarjassa käytän HICP-indeksiä (Harmonised Index of Consumer Prices), joka on EU:n harmonisoitu kuluttajahintaindeksi.Datan lähde on Eurostat, jonka datat ovat saatavissa avoimen rajapinnan kautta. Tämä mahdollistaa toistettavan analyysin ja sen päivittämisen myös tulevalla datalla.

Eurostatin taulukoissa on useita indeksiperustoja (esimerkiksi 2005=100 ja 2015=100). Valitsen 2015=100 -indeksin, joka on nykyinen standardi. Samalla rajaan analyysin Suomeen ja kokonaisinflaatioon (COICOP-luokka CP0).

Aikarakenne: kuukausisarja

Makrodata on lähes aina aikarivimuotoista, joten rakennan analyysin tsibble-rakenteen päälle.

Tässä vaiheessa on tärkeää huomioida yksi yksityiskohta: vaikka päivämäärä näyttää Date-muotoiselta, data on todellisuudessa kuukausisarja. Siksi muutan indeksin eksplisiittisesti kuukausitasolle.

Muunnos inflaatioksi

HICP on indeksisarja. Inflaatio lasketaan yleensä vuosimuutoksena, eli kuinka paljon hinnat ovat muuttuneet verrattuna samaan kuukauteen vuotta aiemmin.

Tässä vaiheessa meillä on analyysiin valmis aikarivi:

Suomen inflaatio 1997–2025

Ensimmäinen askel on katsoa, miltä inflaatio näyttää pitkällä aikavälillä.

Pitkä aikahistoria paljastaa useita selkeitä jaksoja:

2000–2007: suhteellisen vakaa inflaatio

2008–2009: finanssikriisin vaikutus

2010-luku: matala inflaatio Euroopassa

2020: pandemian aiheuttama talousshokki

2022: energiakriisi ja inflaatiopiikki

Erityisesti vuoden 2022 inflaatiohuippu on makrotaloudessa poikkeuksellinen tapahtuma. Tällaiset shokit tekevät ennustamisesta vaikeaa.

Inflaation kausivaihtelu

Vaikka käytän vuosimuutosta, inflaatiossa voi silti esiintyä kausivaihtelua.

Tätä voidaan tarkastella season plot -kuvaajalla.

# A tibble: 1 × 2
  kpss_stat kpss_pvalue
      <dbl>       <dbl>
1     0.246         0.1

Season plot näyttää, miten inflaatio käyttäytyy eri kuukausina eri vuosina.

Makrotaloudessa tämä voi paljastaa esimerkiksi:

Samalla voidaan nähdä, kuinka poikkeuksellinen vuosi 2022 oli suhteessa aikaisempaan historiaan.

Inflaation volatiliteetti

Inflaation keskiarvo kertoo vain osan tarinaa. Yhtä tärkeää on ymmärtää volatiliteetti, eli kuinka paljon inflaatio vaihtelee.

Tarkastellaan 12 kuukauden liukuvaa keskihajontaa.

Tuloksesta näkyy selvästi, että inflaation volatiliteetti ei ole vakio.

Erityisesti vuoden 2022 jälkeen volatiliteetti kasvaa selvästi.

Tämä on tärkeä havainto mallinnuksen kannalta.

Monet perinteiset aikarivimallit olettavat vakion volatiliteetin, mikä voi johtaa liian optimistisiin ennusteisiin kriisiaikoina.

Bayesilainen lähestymistapa mahdollistaa epävarmuuden eksplisiittisen mallintamisen.

Mitä “hyvä ennuste” tarkoittaa?

Ennen kuin rakennan yhtään mallia, täytyy määritellä arviointikriteerit.

Hyvä ennuste ei ole vain tarkka piste-ennuste.

Hyvä ennuste on myös:

Siksi tässä sarjassa käytetään arviointiin proper scoring ruleja, kuten CRPS- ja log score -mittareita.

Ne arvioivat koko ennustejakaumaa, eivät vain yhtä pistettä.

Seuraavassa osassa rakennetaan ensimmäiset ennustemallit. Analyysi aloitetaan tarkoituksella yksinkertaisista baseline-malleista:

random walk

ARIMA

Makrotaloudessa nämä mallit toimivat usein yllättävän vahvoina vertailukohtina.

Vasta tämän jälkeen rakennetaan bayesilainen aikarivimalli brms-paketilla, jonka avulla inflaation ennusteet voidaan esittää täysinä todennäköisyysjakaumina.

Keskeinen kysymys pysyy samana:

Kuinka hyvin inflaatiota on ylipäätään mahdollista ennustaa?

Se selviää sarjan seuraavissa osissa.

Osa2: mallit

Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.