Osa 2: Kuinka vaikeaa inflaation ennustaminen on?

R
Data Science
talous
inflaatio
ennustaminen
Suomen inflaation kuvailua
Published

March 11, 2026

Osa 1

Edellisessä osassa tarkasteltiin Suomen inflaatiodataa ja sen keskeisiä tilastollisia piirteitä. Analyysi osoitti, että inflaatio ei ole vakaa prosessi: siihen liittyy rakenteellisia muutoksia ja merkittäviä volatiliteetin vaihteluita.

Seuraava kysymys kuuluu:

Kuinka hyvin inflaatiota voidaan ennustaa?

Ennen monimutkaisten mallien rakentamista on hyödyllistä aloittaa yksinkertaisista vertailumalleista. Taloustieteessä nämä tunnetaan nimellä baseline models.

Yllättävää kyllä, monet hyvin yksinkertaiset mallit toimivat makrotaloudessa varsin kilpailukykyisesti. Siksi niitä käytetään usein vertailukohtina monimutkaisemmille menetelmille.

Tässä osassa tarkastellaan kahta klassista baseline-mallia:

Näiden avulla voidaan arvioida, kuinka ennustettavaa inflaatio ylipäätään on.

Ennustamisen arviointikehikko

Ennustemallien arvioinnissa yksi keskeinen ongelma liittyy siihen, miten data jaetaan mallin estimointiin ja testaamiseen.

Aikarivianalyysissä tavallinen satunnainen train–test-jako ei ole mahdollinen, koska havaintojen järjestys ajassa on merkityksellinen.

Siksi käytetään rolling-origin -arviointia.

Tässä lähestymistavassa malli estimoidaan aina menneellä datalla ja ennuste tehdään tulevaisuuteen. Prosessi toistetaan useita kertoja eri ajankohdista.

Tämä vastaa realistista ennustamistilannetta.

Ennustehorisontti

Makrotaloudessa inflaatiota tarkastellaan usein vuositasolla. Tässä analyysissä käytetään 12 kuukauden ennustehorisonttia.

Tämä tarkoittaa, että jokaisessa iteroinnissa ennustetaan inflaatiota vuoden päähän.

Random walk -malli

Yksinkertaisin mahdollinen ennustemalli on random walk.

Random walk -mallissa oletetaan, että paras ennuste tulevalle arvolle on nykyinen arvo. Toisin sanoen muutokset ovat täysin satunnaisia.

Matemaattisesti malli voidaan kirjoittaa

\(y_{t+1}=y_t+\epsilon_t\), missä

\(\epsilon_t\) on satunnainen virhetermi.

Vaikka malli on äärimmäisen yksinkertainen, se toimii monissa taloudellisissa aikasarjoissa yllättävän hyvin.

Random walk -mallin estimointi

Random walk voidaan estimoida helposti fable-paketin avulla.

Ennusteen visualisointi

Seuraavaksi tuotetaan ennuste vuoden päähän.

Random walk -malli tuottaa ennusteen, joka seuraa viimeisintä havaintoa. Ennusteeseen liittyvä epävarmuus kasvaa ajan myötä.

Tämä on tyypillistä stokastisille prosesseille.

ARIMA-malli

Toinen klassinen aikarivimalli on ARIMA (AutoRegressive Integrated Moving Average).

ARIMA-mallit yhdistävät kolme komponenttia:

  • autoregressio (AR)

  • differensointi (I)

  • liukuvan keskiarvon termi (MA)

Näiden avulla voidaan mallintaa sarjan riippuvuuksia menneisiin havaintoihin.

ARIMA-mallin estimointi

fable-paketti sisältää automaattisen ARIMA-mallin valinnan.

Mallin rakennetta voidaan tarkastella seuraavasti.

Series: inflation_yoy 
Model: ARIMA(3,0,1)(0,0,2)[12] w/ mean 

Coefficients:
         ar1      ar2      ar3      ma1     sma1     sma2  constant
      1.6836  -0.4907  -0.1995  -0.7549  -0.6611  -0.1811    0.0118
s.e.  0.0871   0.1367   0.0576   0.0766   0.0559   0.0586    0.0008

sigma^2 estimated as 0.09142:  log likelihood=-82.24
AIC=180.48   AICc=180.9   BIC=211.29

Automaattinen mallinvalinta valitsee parametrien yhdistelmän, joka minimoi informaatiokriteerin (yleensä AICc).

ARIMA-ennuste

Seuraavaksi tuotetaan ennuste vuoden päähän.

ARIMA-malli reagoi inflaation historialliseen dynamiikkaan. Tämä voi tuottaa realistisempia ennusteita kuin random walk, jos sarjassa on systemaattisia riippuvuuksia.

Rolling-origin -arviointi

Yksittäinen ennuste ei kuitenkaan riitä mallien vertailuun.

Tarvitaan systemaattinen arviointi useiden ennustetilanteiden yli. Tämä voidaan tehdä stretch_tsibble()-funktion avulla.

Tässä:

  • ensimmäinen estimointijakso sisältää 120 havaintoa

  • ennusteharjoitus toistetaan jokaisessa seuraavassa ajankohdassa

Tämä tuottaa realistisen simulaation ennustetilanteista.

Mallien estimointi cross-validationissa

Yksittäinen malli ei vielä kerro mitään ennustemenetelmän todellisesta suorituskyvystä. Mallien toimivuutta on arvioitava tilanteessa, jossa ennuste tehdään aina vain menneeseen tietoon perustuen.

Tätä varten käytetään rolling-origin cross-validation -menetelmää, joka on aikarivianalyysin standardi lähestymistapa. Menetelmässä aineistoa ei jaeta satunnaisesti opetus- ja testijoukkoihin. Sen sijaan mallia estimoidaan toistuvasti kasvavalla havaintojoukolla, ja jokaisessa vaiheessa ennuste tehdään tulevaisuuteen.

Prosessi etenee seuraavasti:

  1. Malli estimoidaan ensimmäisestä havaintojaksosta.

  2. Ennuste tuotetaan tuleville kuukausille.

  3. Malli estimoidaan uudelleen hieman pidemmällä datalla.

  4. Ennuste tuotetaan uudelleen.

  5. Tämä toistetaan jokaisessa ajankohdassa koko aineiston läpi.

Tällä tavoin syntyy suuri joukko ennusteita, jotka simuloivat realistista ennustamistilannetta. Jokainen ennuste perustuu vain siihen tietoon, joka olisi ollut saatavilla kyseisenä ajankohtana.

Tässä analyysissä cross-validationissa estimoidaan kaksi mallia:

  • random walk

  • ARIMA

Näitä käytetään baseline-malleina, joihin myöhemmät bayesilaiset mallit voidaan myöhemmin verrata.

Ennusteet

Kun mallit on estimoitu cross-validation -kehikossa, voidaan tuottaa ennusteet jokaiselle arviointijaksolle.

Jokaisessa iteroinnissa malli tuottaa ennusteen inflaatiolle seuraaville kuukausille. Näin muodostuu suuri joukko ennusteita eri ajankohdista. Tämä mahdollistaa mallien suorituskyvyn arvioinnin historiallisessa datassa.

Keskeinen etu tässä lähestymistavassa on se, että ennusteita ei arvioida vain yhdessä tilanteessa. Sen sijaan mallin suorituskykyä tarkastellaan monissa eri taloustilanteissa, kuten

  • matalan inflaation aikana

  • talouskriisien aikana

  • voimakkaiden hintashokkien aikana

Tämä on tärkeää erityisesti makrotaloudessa, jossa talouden dynamiikka voi muuttua nopeasti.

Kun ennusteet on tuotettu, niiden tarkkuutta voidaan arvioida vertaamalla ennustettuja arvoja toteutuneeseen inflaatioon. Seuraavassa vaiheessa mallien suorituskykyä arvioidaan erilaisten ennustetarkkuusmittareiden avulla.

Ennustetarkkuus

Ennustemallien tarkkuutta voidaan arvioida esimerkiksi seuraavilla mittareilla:

  • RMSE (Root Mean Squared Error)

  • MAE (Mean Absolute Error)

# A tibble: 2 × 10
  .model .type      ME  RMSE   MAE    MPE  MAPE  MASE RMSSE  ACF1
  <chr>  <chr>   <dbl> <dbl> <dbl>  <dbl> <dbl> <dbl> <dbl> <dbl>
1 ARIMA  Test   0.254   1.42 0.912   7.72  174. 0.694 0.729 0.888
2 RW     Test  -0.0232  1.57 1.00  -11.5   121. 0.761 0.809 0.888

Tulokset kertovat, kumpi baseline-malli tuottaa tarkempia ennusteita historiallisessa datassa.

Makrotaloudessa ei ole harvinaista, että random walk toimii lähes yhtä hyvin kuin monimutkaisemmat mallit.

Jos näin tapahtuu, se kertoo paljon itse ilmiön ennustettavuudesta.

Baseline-mallit ovat tärkeä askel analyysissä, koska ne määrittävät vähimmäistason, jonka monimutkaisempien mallien tulee ylittää.

Jos kehittyneempi malli ei paranna ennustetarkkuutta, sen lisäämä monimutkaisuus ei ole perusteltua.

Osa3: Bayeslainen malli

Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.