STEM vs humanistiset alat — empiirisesti, ei ideologisesti

Osa 7 – Palkkajakaumat, työllistyminen, riski

data science
työmarkkinat
koulutus
R
tilastotiede
Author

Kristian Vepsäläinen

Published

19.5.2026

1 Tiivistelmä

Keskustelu STEM-aloista (tiede, teknologia, tekniikka, matematiikka) vs humanistiset alat on ollut viimeiset 15 vuotta vahvasti polarisoitunutta. “Humanisti ei saa töitä” — “STEM-hype ylikouluttaa insinöörejä”. Molemmat väitteet ovat empiirisiä hypoteeseja, joita voi testata datalla.

Tässä osassa vertailemme aloja ilman ideologista ennakkokantaa:

  • palkan jakauma (ei keskiarvo)
  • työllistyminen ja työttömyyden riski
  • urien vaihtelu ja riskijakauma

Keskeinen tulos: STEM-alat tarjoavat keskimäärin korkeamman palkan ja varmemman työllistymisen, mutta humanistisissa aloissa jakauma on hajonnaltaan pienempi tyypillisissä kvantiileissa. Stokastinen dominanssi ei päde kaikissa kvantiileissa.

Maailma on jakauma. Ja kaksi jakaumaa voi olla vaikea järjestää yksiselitteiseen paremmuusjärjestykseen.


2 Tutkimuskysymys

  1. Onko STEM-ala stokastisesti dominoiva humanistiseen alaan nähden palkkajakauman suhteen?
  2. Missä kvantiileissa erot ovat suurimpia?
  3. Onko työttömyysriski selvästi erilainen?

Stokastinen dominanssi tarkoittaa: jokaisessa kvantiilissa jakaumassa A on yhtä suuri tai suurempi arvo kuin jakaumassa B. Jos näin on, A on yksiselitteisesti parempi. Jos ei, vertailu on arvoriippuvainen.


3 Datalähteet

  • Tilastokeskus: Palkkarakenne (PR), ansiotutkimus. Yksilöitason dataa ei saatavilla, mutta aggregoidut jakaumat kyllä.
  • Eurostat: earn_ses_* -taulukot palkkajakaumista
  • Vipunen: koulutusaloittainen sijoittuminen (käytettiin osassa 6)

Koska rekisteritason mikroaineistoa ei ole julkisesti saatavilla, konstruoimme realistiset palkkajakaumat OECD:n ja Tilastokeskuksen aggregoitujen kvantiilitietojen pohjalta.

4 Palkkajakaumien vertailu

Figure 1: Palkkajakaumat STEM vs humanistiset alat

Kaksi jakaumaa eroavat selvästi — mutta päällekkäisyys on suurta. Humanistin palkka voi olla korkeampi kuin STEM-ammattilaisen, vaikka keskimäärin näin ei ole.

5 Quantile regression

Quantile regression antaa tarkan vastauksen kysymykseen: “missä palkkajakauman kohdissa ero on suurin?”

# A tibble: 9 × 3
  kvantiili intercept stem_efekti
      <dbl>     <dbl>       <dbl>
1         0      2376        -475
2         0      2703        -559
3         0      2953        -639
4         0      3177        -704
5         0      3402        -792
6         1      3647        -859
7         1      3942        -940
8         1      4310       -1065
9         1      4884       -1306
Figure 2: STEM-palkkaetu jakauman eri kvantiileissa

Tulkinta: ero on yleensä suurin ylimmissä kvantiileissa. STEM-alan palkkojen oikeanpuoleinen häntä on pidempi. Alimmissa kvantiileissa ero on merkittävästi pienempi — eli “huonosti tienaava STEM” ei tienaa paljon enempää kuin “hyvin tienaava humanisti”.

6 Stokastinen dominanssi

Ensimmäisen asteen stokastinen dominanssi: jokaisessa palkkatasolla \(x\), \(F_{STEM}(x) \leq F_{Humanist}(x)\).

Figure 3: Kumulatiiviset jakaumat: STEM vs humanistinen

Jos simuloitujen jakaumien käyrät eivät risteä, STEM dominoi ensimmäisen asteen stokastisesti. Todellisessa datassa pieni risteys matalissa palkoissa on mahdollinen.

7 Työttömyysriski

Palkka on vain osa tuottoa. Työttömyyden riski pitää ottaa huomioon.

STEM-alat ovat johdonmukaisesti matalan työttömyysasteen päässä, humanistiset ja yhteiskuntatieteelliset korkeammalla. Mutta ero on luokkaa 4–5 prosenttiyksikköä, ei kymmeniä.

8 Ura-arvon jakauma: yhdistetty mittari

Lasketaan yhdistetty tuotto-odotus, joka ottaa huomioon sekä palkan että työttömyysriskin:

\[ E[\text{tuotto}] = (1 - p_{tyoton}) \cdot E[\text{palkka} | \text{tyossa}] \]

# A tibble: 2 × 4
  ala          keskiansio tyottomyys odotettu_tuotto
  <chr>             <dbl>      <dbl>           <dbl>
1 STEM               4380          0            4174
2 Humanistinen       3556          0            3239

Ero työllistymisellä painotetussa odotetussa tuotossa on selvä, mutta ei dramaattinen.

9 Riskin hinta: Monte Carlo simulaatio

Simuloidaan 5000 urapolkua molemmilta aloilta 20 vuoden aikajänteellä, joissa työttömyysjaksot satunnaistetaan.

Figure 4: Monte Carlo: 20 vuoden nettotulojen jakauma
# A tibble: 2 × 6
  ala          mediaani      ka    p10     p90 vaihtelu
  <chr>           <dbl>   <dbl>  <dbl>   <dbl>    <dbl>
1 Humanistinen   808724  809681 735605  885335   149731
2 STEM          1026128 1029683 934539 1127987   193448

Huomio: STEM-jakauman mediaani on selvästi korkeampi, mutta 10–90 % -kvantiiliväli on myös laajempi. Humanistinen ala tarjoaa matalamman keskiarvon mutta kapeamman riskin.

10 Onko “paras ala” kysymys järkevä?

Ei. Oikea kysymys on: “kenelle mikin ala sopii parhaiten, gien preferenssit palkan, riskin ja ei-taloudellisten tekijöiden välillä?”

Jos henkilön hyödyntämisfunktio painottaa voimakkaasti korkean tulon mahdollisuutta ja hän on riskinottaja, STEM saattaa olla parempi. Jos hyödynfunktio painottaa kiinnostusta, työn merkityksellisyyttä tai riskin välttämistä, humanistinen voi olla parempi.

Datalla voi kuvata jakaumat. Arvot eivät ole datapohjaisia.

11 Yhteenveto

  1. STEM-alojen palkat ovat keskimäärin korkeampia, mutta hajonta on suuri — jakaumat menevät päällekkäin.
  2. Quantile regression osoittaa, että ero on suurin ylimmässä kvantiileissa. Mediaanin tasolla ero on pienempi.
  3. Työttömyysaste on STEM-aloilla matalampi, tyypillisesti 3–5 %-yksikköä vähemmän kuin humanistisissa.
  4. Monte Carlo -simulaatiot osoittavat, että 20 vuoden kumulatiivinen tulo on STEM-aloilla korkeampi, mutta molemmissa on merkittävää vaihtelua.
  5. Stokastista dominanssia ei välttämättä ole — on kvantiileja, joissa humanistinen ala voi olla parempi.

maailma on jakauma

ja kahta jakaumaa ei voi useinkaan järjestää yksiselitteiseen paremmuusjärjestykseen. Arvoa riippuu siitä, mitä lukijat jakaumalta arvostavat.

12 Lähteet ja huomiot

  • Tilastokeskus: Palkkarakenne (PR)
  • Eurostat: earn_ses_*, edat_lfse_24
  • Vipunen: sijoittumispalvelu
  • Mincer, J. (1974). Schooling, Experience and Earnings.
  • Koenker, R. (2005). Quantile Regression. CUP.

Metodologinen huomio: palkkajakaumien simulointi perustuu aggregoituihin kvantiileihin. Todelliset yksilötason analyysit vaativat rekisteriaineiston (FOLK + Tulokynsi). Esitetyt luvut ovat suuruusluokissa realistisia mutta eivät tarkkoja pistearvoja.

13 Mitä seuraavaksi?

Osassa 8 tarkastelemme, onko osaamistaso heikentynyt. PISA-trendit, keskeyttämisasteet, arvosanainflaatio — ja se herkkä kysymys: ovatko nuoret aikuiset aikaisempaa heikompia vai paremmin koulutettuja?


Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.