
Osa 2: Kuinka vaikeaa inflaation ennustaminen on?
Edellisessä osassa tarkasteltiin Suomen inflaatiodataa ja sen keskeisiä tilastollisia piirteitä. Analyysi osoitti, että inflaatio ei ole vakaa prosessi: siihen liittyy rakenteellisia muutoksia ja merkittäviä volatiliteetin vaihteluita.
Seuraava kysymys kuuluu:
Kuinka hyvin inflaatiota voidaan ennustaa?
Ennen monimutkaisten mallien rakentamista on hyödyllistä aloittaa yksinkertaisista vertailumalleista. Taloustieteessä nämä tunnetaan nimellä baseline models.
Yllättävää kyllä, monet hyvin yksinkertaiset mallit toimivat makrotaloudessa varsin kilpailukykyisesti. Siksi niitä käytetään usein vertailukohtina monimutkaisemmille menetelmille.
Tässä osassa tarkastellaan kahta klassista baseline-mallia:
random walk
ARIMA
Näiden avulla voidaan arvioida, kuinka ennustettavaa inflaatio ylipäätään on.
Ennustamisen arviointikehikko
Ennustemallien arvioinnissa yksi keskeinen ongelma liittyy siihen, miten data jaetaan mallin estimointiin ja testaamiseen.
Aikarivianalyysissä tavallinen satunnainen train–test-jako ei ole mahdollinen, koska havaintojen järjestys ajassa on merkityksellinen.
Siksi käytetään rolling-origin -arviointia.
Tässä lähestymistavassa malli estimoidaan aina menneellä datalla ja ennuste tehdään tulevaisuuteen. Prosessi toistetaan useita kertoja eri ajankohdista.
Tämä vastaa realistista ennustamistilannetta.
Ennustehorisontti
Makrotaloudessa inflaatiota tarkastellaan usein vuositasolla. Tässä analyysissä käytetään 12 kuukauden ennustehorisonttia.
Tämä tarkoittaa, että jokaisessa iteroinnissa ennustetaan inflaatiota vuoden päähän.
Random walk -malli
Yksinkertaisin mahdollinen ennustemalli on random walk.
Random walk -mallissa oletetaan, että paras ennuste tulevalle arvolle on nykyinen arvo. Toisin sanoen muutokset ovat täysin satunnaisia.
Matemaattisesti malli voidaan kirjoittaa
\(y_{t+1}=y_t+\epsilon_t\), missä
\(\epsilon_t\) on satunnainen virhetermi.
Vaikka malli on äärimmäisen yksinkertainen, se toimii monissa taloudellisissa aikasarjoissa yllättävän hyvin.
Random walk -mallin estimointi
Random walk voidaan estimoida helposti fable-paketin avulla.
Ennusteen visualisointi
Seuraavaksi tuotetaan ennuste vuoden päähän.
Random walk -malli tuottaa ennusteen, joka seuraa viimeisintä havaintoa. Ennusteeseen liittyvä epävarmuus kasvaa ajan myötä.
Tämä on tyypillistä stokastisille prosesseille.
ARIMA-malli
Toinen klassinen aikarivimalli on ARIMA (AutoRegressive Integrated Moving Average).
ARIMA-mallit yhdistävät kolme komponenttia:
autoregressio (AR)
differensointi (I)
liukuvan keskiarvon termi (MA)
Näiden avulla voidaan mallintaa sarjan riippuvuuksia menneisiin havaintoihin.
ARIMA-mallin estimointi
fable-paketti sisältää automaattisen ARIMA-mallin valinnan.
Mallin rakennetta voidaan tarkastella seuraavasti.
Series: inflation_yoy
Model: ARIMA(3,0,1)(0,0,2)[12] w/ mean
Coefficients:
ar1 ar2 ar3 ma1 sma1 sma2 constant
1.6836 -0.4907 -0.1995 -0.7549 -0.6611 -0.1811 0.0118
s.e. 0.0871 0.1367 0.0576 0.0766 0.0559 0.0586 0.0008
sigma^2 estimated as 0.09142: log likelihood=-82.24
AIC=180.48 AICc=180.9 BIC=211.29
Automaattinen mallinvalinta valitsee parametrien yhdistelmän, joka minimoi informaatiokriteerin (yleensä AICc).
ARIMA-ennuste
Seuraavaksi tuotetaan ennuste vuoden päähän.

ARIMA-malli reagoi inflaation historialliseen dynamiikkaan. Tämä voi tuottaa realistisempia ennusteita kuin random walk, jos sarjassa on systemaattisia riippuvuuksia.
Rolling-origin -arviointi
Yksittäinen ennuste ei kuitenkaan riitä mallien vertailuun.
Tarvitaan systemaattinen arviointi useiden ennustetilanteiden yli. Tämä voidaan tehdä stretch_tsibble()-funktion avulla.
Tässä:
ensimmäinen estimointijakso sisältää 120 havaintoa
ennusteharjoitus toistetaan jokaisessa seuraavassa ajankohdassa
Tämä tuottaa realistisen simulaation ennustetilanteista.
Mallien estimointi cross-validationissa
Yksittäinen malli ei vielä kerro mitään ennustemenetelmän todellisesta suorituskyvystä. Mallien toimivuutta on arvioitava tilanteessa, jossa ennuste tehdään aina vain menneeseen tietoon perustuen.
Tätä varten käytetään rolling-origin cross-validation -menetelmää, joka on aikarivianalyysin standardi lähestymistapa. Menetelmässä aineistoa ei jaeta satunnaisesti opetus- ja testijoukkoihin. Sen sijaan mallia estimoidaan toistuvasti kasvavalla havaintojoukolla, ja jokaisessa vaiheessa ennuste tehdään tulevaisuuteen.
Prosessi etenee seuraavasti:
Malli estimoidaan ensimmäisestä havaintojaksosta.
Ennuste tuotetaan tuleville kuukausille.
Malli estimoidaan uudelleen hieman pidemmällä datalla.
Ennuste tuotetaan uudelleen.
Tämä toistetaan jokaisessa ajankohdassa koko aineiston läpi.
Tällä tavoin syntyy suuri joukko ennusteita, jotka simuloivat realistista ennustamistilannetta. Jokainen ennuste perustuu vain siihen tietoon, joka olisi ollut saatavilla kyseisenä ajankohtana.
Tässä analyysissä cross-validationissa estimoidaan kaksi mallia:
random walk
ARIMA
Näitä käytetään baseline-malleina, joihin myöhemmät bayesilaiset mallit voidaan myöhemmin verrata.
Ennusteet
Kun mallit on estimoitu cross-validation -kehikossa, voidaan tuottaa ennusteet jokaiselle arviointijaksolle.
Jokaisessa iteroinnissa malli tuottaa ennusteen inflaatiolle seuraaville kuukausille. Näin muodostuu suuri joukko ennusteita eri ajankohdista. Tämä mahdollistaa mallien suorituskyvyn arvioinnin historiallisessa datassa.
Keskeinen etu tässä lähestymistavassa on se, että ennusteita ei arvioida vain yhdessä tilanteessa. Sen sijaan mallin suorituskykyä tarkastellaan monissa eri taloustilanteissa, kuten
matalan inflaation aikana
talouskriisien aikana
voimakkaiden hintashokkien aikana
Tämä on tärkeää erityisesti makrotaloudessa, jossa talouden dynamiikka voi muuttua nopeasti.
Kun ennusteet on tuotettu, niiden tarkkuutta voidaan arvioida vertaamalla ennustettuja arvoja toteutuneeseen inflaatioon. Seuraavassa vaiheessa mallien suorituskykyä arvioidaan erilaisten ennustetarkkuusmittareiden avulla.
Ennustetarkkuus
Ennustemallien tarkkuutta voidaan arvioida esimerkiksi seuraavilla mittareilla:
RMSE (Root Mean Squared Error)
MAE (Mean Absolute Error)
# A tibble: 2 × 10
.model .type ME RMSE MAE MPE MAPE MASE RMSSE ACF1
<chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 ARIMA Test 0.254 1.42 0.912 7.72 174. 0.694 0.729 0.888
2 RW Test -0.0232 1.57 1.00 -11.5 121. 0.761 0.809 0.888
Tulokset kertovat, kumpi baseline-malli tuottaa tarkempia ennusteita historiallisessa datassa.
Makrotaloudessa ei ole harvinaista, että random walk toimii lähes yhtä hyvin kuin monimutkaisemmat mallit.
Jos näin tapahtuu, se kertoo paljon itse ilmiön ennustettavuudesta.
Baseline-mallit ovat tärkeä askel analyysissä, koska ne määrittävät vähimmäistason, jonka monimutkaisempien mallien tulee ylittää.
Jos kehittyneempi malli ei paranna ennustetarkkuutta, sen lisäämä monimutkaisuus ei ole perusteltua.
Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.