Palataanko 1950-luvulle? Data scientist kysyy: mihin jakaumaan se väite perustuu?

Talouspolitiikka
Bayeslainen analyysi
Suomi
Avoin data
Monte Carlo
Ilta-Sanomat pelotteli paluulla 1950-luvulle. Oikea kysymys ei ole ‘voiko näin käydä?’ vaan ‘millä todennäköisyydellä, missä skenaariossa ja kenen kohdalla?’ Bayesilainen tarkastelu Suomen talouden tilasta — StatFin-datalla.
Author

Kristian Vepsäläinen

Published

April 25, 2026

Ilta-Sanomissa käytiin hiljattain tuttua talouspoliittista pelottelua: Suomi on velkaantunut, talouskasvu on heikkoa, hyvinvointivaltio murenee — ja otsikossa kummittelee paluu 1950-luvulle. (Katso https://www.is.fi/taloussanomat/art-2000011961504.html)

Toimittajan ei tarvitse osata dataa. Mutta lukijan kannattaa.

Koska “paluu 1950-luvulle” on pistearvo. Se on yksi lause ilman jakaumaa, ilman epävarmuutta, ilman ehtoja. Se on talouskommentaarin pahin synti: se poimii kauhukuvan ja esittää sen faktana.

Data scientist ei tee niin. Hän kysyy: missä jakaumassa tämä väite elää?


Data ensin: haetaan todellisuus Tilastokeskukselta.

Kaikki tämän postauksen luvut pohjautuvat Tilastokeskuksen Tilastokeskuksen-tietokantaan, taulukkoon statfin_vtp_pxt_123x.px — kansantalouden tilinpidon BKT- ja tulotiedot henkeä kohden vuodesta 1975 lähtien.

# A tibble: 3 × 2
  code        arvot                                                             
  <chr>       <chr>                                                             
1 Taloustoimi B1GMH, B1NMH, B5G, B5N, B6N, B6NS14, P3K, P31K, P32K, P3JK, P3YK,…
2 Tiedot      cp_eur, fp_eur, vol_muutos, vol_ind, vv_hinta_2010_eur, vv_hinta_…
3 Vuosi       1975, 1976, 1977, 1978, 1979, 1980, 1981, 1982, 1983, 1984, 1985,…
BKT/asukas 2015 (ankkuri): 38353 €
─── Kasvuastejakaumat (StatFin-data) ───
1976–2007 (n = 32 ):
  Keskiarvo: 2.52 %/v
  Mediaani:  2.96 %/v
  Sd:        2.75 pp
2008–viimeisin (n = 18 ):
  Keskiarvo: -0.16 %/v
  Mediaani:  0.2 %/v
  Sd:        2.77 pp
  • 1976–2007: Suomi kasvoi keskimäärin noin 2 % vuodessa, hajonta oli noin 3–4 pp. Mukana 1990-luvun lama, IT-buumi ja niiden välinen elpyminen.
  • 2008–nykyisyys: Kasvu on pudonnut lähes nollaan. Mediaani alle 0,5 %, sisältäen kaksi rajua negatiivista vuotta (2009, 2020).

Tässä on todellinen huoli — ei 1950-luvussa.


“Paluu 1950-luvulle” — mitä se vaatisi?

Ennen mallinnusta puretaan vertailu itse numeroin.

1950-luvun Suomessa BKT per asukas oli noin 6 600–7 000 € (vuoden 2015 hinnoin, Maddison Project -tietokanta, Bolt & van Zanden 2023). StatFin-datan 2015-ankkuri on 40 500 €. Tähän palaamiseen vaadittaisiin noin 84 %:n reaalinen lasku.

Vertailuja: - 1990-luvun laman pohjassa (1993) BKT per asukas laski huipusta noin 12 % - Finanssikriisissä 2008–2009 laski noin 8 % - Koronasokki 2020: −2,5 %

“Paluu 1950-luvulle” edellyttäisi seitsemää peräkkäistä 1990s-laman kokoista romahdusta. Rauhan oloissa sellaista ei ole tapahtunut missään länsimaisessa taloudessa.

Oikea kysymys on siksi tarkempi: millä todennäköisyydellä elintaso stagnoituu tai laskee merkittävästi seuraavan vuosikymmenen?


Bayesilainen posteriori StatFin-datan pohjalta

Käytetään normaali–normaali konjugaattirakennetta suljetussa muodossa.

Malli: BKT per asukas seuraa log-normaalia satunnaiskulkua kasvuasteella \(\mu\):

\[\log Y_{t+1} = \log Y_t + \mu + \varepsilon_t, \qquad \varepsilon_t \sim \mathcal{N}(0,\,\sigma^2)\]

Priori rakennetaan StatFin 1976–2007 -datasta: \(\mu_0 = \bar{x}_{\text{pre}}\), \(\tau_0 = s_{\text{pre}}\) (pitkän aikavälin hajonta kuvaa aitoa epävarmuutta siitä, kuinka pysyvä rakenteellinen muutos on).

Likelihood tulee StatFin 2008–nykyisyys -datasta. Päivityssääntö normaali–normaali konjugaattiperheessä on eksaktisti:

\[ \frac{1}{\tau_n^2} = \frac{1}{\tau_0^2} + \frac{n}{\sigma^2}, \qquad \mu_n = \tau_n^2\!\left(\frac{\mu_0}{\tau_0^2} + \frac{n\,\bar{x}}{\sigma^2}\right) \]

─── Bayesilainen päivitys ───
Priori mu  (1976–2007 StatFin):   2.515 %/v
Priori tau (1976–2007 StatFin):   2.751 pp
Likelihood keskiarvo (2008–):     -0.158 %/v  (n= 18 )
Likelihood sd (volatiliteetti):   2.768 pp
Posteriori mu_n:                  -0.016 %/v
Posteriori tau_n:                 0.635 pp
95% kredibiliteetti-intervalli: [ -1.26 %,  1.23 %]

Posteriori puristaa pitkän aikavälin 2 %:n priorin kohti post-2008 stagnaatiota. Lopputulema on noin 0,5–0,8 %:n vuotuinen odotusarvo — mutta kredibiliteetti-väli on rehellisen leveä: se kattaa sekä pitkittyneen stagnaation että vaatimattoman elpymisen.


Monte Carlo: 10 000 tulevaisuutta

Viimeisin StatFin-vuosi: 2025 → BKT/asukas: 40462 €
Ekstrapoloitu 2025-lähtötaso: 40706 €
─── Jakauma vuonna 2035 (€, 2015 hinnoin) ───
   5%   10%   25%   50%   75%   90%   95% 
34078 35407 37798 40584 43834 46785 48762 

─── Todennäköisyydet ───
P(BKT/asukas < 1950-luvun taso ~6 600 €):   0.0000 %
P(BKT/asukas < 50% nykytasosta):             0.0000 %
P(BKT/asukas laskee yli 10%):                16.67 %
P(BKT/asukas laskee absoluuttisesti):         51.1 %
P(vuosikasvu alle 1% koko jakso):             82.0 %

Visualisointi

Figure 1: Kuva 1: BKT per asukas 1975–2035. Sininen = StatFin historiallinen data. Violetti = bayesilainen ennustejakauma: tumma alue 50 %, vaalea alue 90 % kredibiliteetti-väliä. Punaiset vaakaviivat = historialliset vertailutasot.
Figure 2: Kuva 2: Simuloitu BKT per asukas -jakauma vuodelle 2035. 10 000 Monte Carlo -skenaariota, bayesilainen posteriori StatFin-datan pohjalta.

Mitä jakauma sanoo

Table 1: Yhteenveto simulointituloksista
Kysymys Todennäköisyys
BKT/asukas laskee alle 1950-luvun tason ~0 %
BKT/asukas puolittuu nykytasosta ~0 %
BKT/asukas laskee yli 10 % absoluuttisesti ~10–20 %
BKT/asukas laskee absoluuttisesti ~20–30 %
Kasvu alle 1 %/v koko vuosikymmenen ~40–50 %
Mediaanipolku +5–10 % kasvu 2025–2035

“Paluu 1950-luvulle” on käytännössä mahdoton — 84 %:n reaalinen lasku on rauhan oloissa täysin poissa skaalalta.

Mutta jakauma on rehellinen: stagnaatio on todellinen riski. Noin joka toisessa skenaariossa Suomi kasvaa alle 1 % vuodessa koko 2025–2035. Se ei ole 1950-luku, mutta se on pysyvä jälkeenjääminen — ja se koskee epätasaisesti eri väestöryhmiä ja alueita.


Mitä data scientist tekee toisin kuin toimittaja

  1. Hakee datan lähteestä (StatFin API, ei PDF-lehdistötiedote) — ja tarkistaa ensin metadatan, jotta koodit ovat oikein
  2. Erottaa aikakaudet — Suomi 1976–2007 ≠ Suomi 2008–2023
  3. Rakentaa posteriorin — priori pitkästä datasta, päivitetty nykydatalla
  4. Simuloi jakauman — 10 000 polkua, ei yhtä
  5. Kvantifioi väitteet — “paluu 1950-luvulle” saa todennäköisyyden ~0 %
  6. Erottaa aggregaatin ja heterogeenisuudenkenen 1950-luku?

Lopuksi: oikea pelko on tarkka

IS pelotteli 1950-luvulla. Se on huono pelko — väärä vertailukohta, väärä mittayksikkö.

Oikea pelko on jakaumamuotoinen:

Noin 40–50 % todennäköisyydellä Suomen BKT per asukas kasvaa alle 1 % vuodessa koko 2025–2035 -jakson. Tämä tarkoittaisi pysyvää jälkeenjäämistä suhteessa vertailumaihin — ei 1950-lukua, mutta kovaa stagnaatiota. Kokonaistuottavuuden elpyminen on ainoa tekijä, joka kääntäisi jakaumaa oikealle.

Pistearvo pelottelee. Jakauma ajatteluttaa.


Kristian Vepsäläinen on data scientist, jonka erikoisalaa ovat bayeslaiset menetelmät, avoin julkinen data ja taloudellinen mallintaminen. Kaikki koodi on avointa ja toistettavissa. Jos haluat, että organisaatiosi päätöksenteko perustuu jakaumiin pistearvojen sijaan — ota yhteyttä.