1 Tiivistelmä
Keskustelu STEM-aloista (tiede, teknologia, tekniikka, matematiikka) vs humanistiset alat on ollut viimeiset 15 vuotta vahvasti polarisoitunutta. “Humanisti ei saa töitä” — “STEM-hype ylikouluttaa insinöörejä”. Molemmat väitteet ovat empiirisiä hypoteeseja, joita voi testata datalla.
Tässä osassa vertailemme aloja ilman ideologista ennakkokantaa:
- palkan jakauma (ei keskiarvo)
- työllistyminen ja työttömyyden riski
- urien vaihtelu ja riskijakauma
Keskeinen tulos: STEM-alat tarjoavat keskimäärin korkeamman palkan ja varmemman työllistymisen, mutta humanistisissa aloissa jakauma on hajonnaltaan pienempi tyypillisissä kvantiileissa. Stokastinen dominanssi ei päde kaikissa kvantiileissa.
Maailma on jakauma. Ja kaksi jakaumaa voi olla vaikea järjestää yksiselitteiseen paremmuusjärjestykseen.
2 Tutkimuskysymys
- Onko STEM-ala stokastisesti dominoiva humanistiseen alaan nähden palkkajakauman suhteen?
- Missä kvantiileissa erot ovat suurimpia?
- Onko työttömyysriski selvästi erilainen?
Stokastinen dominanssi tarkoittaa: jokaisessa kvantiilissa jakaumassa A on yhtä suuri tai suurempi arvo kuin jakaumassa B. Jos näin on, A on yksiselitteisesti parempi. Jos ei, vertailu on arvoriippuvainen.
3 Datalähteet
- Tilastokeskus: Palkkarakenne (PR), ansiotutkimus. Yksilöitason dataa ei saatavilla, mutta aggregoidut jakaumat kyllä.
- Eurostat:
earn_ses_*-taulukot palkkajakaumista - Vipunen: koulutusaloittainen sijoittuminen (käytettiin osassa 6)
Koska rekisteritason mikroaineistoa ei ole julkisesti saatavilla, konstruoimme realistiset palkkajakaumat OECD:n ja Tilastokeskuksen aggregoitujen kvantiilitietojen pohjalta.
4 Palkkajakaumien vertailu
Kaksi jakaumaa eroavat selvästi — mutta päällekkäisyys on suurta. Humanistin palkka voi olla korkeampi kuin STEM-ammattilaisen, vaikka keskimäärin näin ei ole.
5 Quantile regression
Quantile regression antaa tarkan vastauksen kysymykseen: “missä palkkajakauman kohdissa ero on suurin?”
# A tibble: 9 × 3
kvantiili intercept stem_efekti
<dbl> <dbl> <dbl>
1 0 2376 -475
2 0 2703 -559
3 0 2953 -639
4 0 3177 -704
5 0 3402 -792
6 1 3647 -859
7 1 3942 -940
8 1 4310 -1065
9 1 4884 -1306
Tulkinta: ero on yleensä suurin ylimmissä kvantiileissa. STEM-alan palkkojen oikeanpuoleinen häntä on pidempi. Alimmissa kvantiileissa ero on merkittävästi pienempi — eli “huonosti tienaava STEM” ei tienaa paljon enempää kuin “hyvin tienaava humanisti”.
6 Stokastinen dominanssi
Ensimmäisen asteen stokastinen dominanssi: jokaisessa palkkatasolla \(x\), \(F_{STEM}(x) \leq F_{Humanist}(x)\).
Jos simuloitujen jakaumien käyrät eivät risteä, STEM dominoi ensimmäisen asteen stokastisesti. Todellisessa datassa pieni risteys matalissa palkoissa on mahdollinen.
7 Työttömyysriski
Palkka on vain osa tuottoa. Työttömyyden riski pitää ottaa huomioon.

STEM-alat ovat johdonmukaisesti matalan työttömyysasteen päässä, humanistiset ja yhteiskuntatieteelliset korkeammalla. Mutta ero on luokkaa 4–5 prosenttiyksikköä, ei kymmeniä.
8 Ura-arvon jakauma: yhdistetty mittari
Lasketaan yhdistetty tuotto-odotus, joka ottaa huomioon sekä palkan että työttömyysriskin:
\[ E[\text{tuotto}] = (1 - p_{tyoton}) \cdot E[\text{palkka} | \text{tyossa}] \]
# A tibble: 2 × 4
ala keskiansio tyottomyys odotettu_tuotto
<chr> <dbl> <dbl> <dbl>
1 STEM 4380 0 4174
2 Humanistinen 3556 0 3239
Ero työllistymisellä painotetussa odotetussa tuotossa on selvä, mutta ei dramaattinen.
9 Riskin hinta: Monte Carlo simulaatio
Simuloidaan 5000 urapolkua molemmilta aloilta 20 vuoden aikajänteellä, joissa työttömyysjaksot satunnaistetaan.
# A tibble: 2 × 6
ala mediaani ka p10 p90 vaihtelu
<chr> <dbl> <dbl> <dbl> <dbl> <dbl>
1 Humanistinen 808724 809681 735605 885335 149731
2 STEM 1026128 1029683 934539 1127987 193448
Huomio: STEM-jakauman mediaani on selvästi korkeampi, mutta 10–90 % -kvantiiliväli on myös laajempi. Humanistinen ala tarjoaa matalamman keskiarvon mutta kapeamman riskin.
10 Onko “paras ala” kysymys järkevä?
Ei. Oikea kysymys on: “kenelle mikin ala sopii parhaiten, gien preferenssit palkan, riskin ja ei-taloudellisten tekijöiden välillä?”
Jos henkilön hyödyntämisfunktio painottaa voimakkaasti korkean tulon mahdollisuutta ja hän on riskinottaja, STEM saattaa olla parempi. Jos hyödynfunktio painottaa kiinnostusta, työn merkityksellisyyttä tai riskin välttämistä, humanistinen voi olla parempi.
Datalla voi kuvata jakaumat. Arvot eivät ole datapohjaisia.
11 Yhteenveto
- STEM-alojen palkat ovat keskimäärin korkeampia, mutta hajonta on suuri — jakaumat menevät päällekkäin.
- Quantile regression osoittaa, että ero on suurin ylimmässä kvantiileissa. Mediaanin tasolla ero on pienempi.
- Työttömyysaste on STEM-aloilla matalampi, tyypillisesti 3–5 %-yksikköä vähemmän kuin humanistisissa.
- Monte Carlo -simulaatiot osoittavat, että 20 vuoden kumulatiivinen tulo on STEM-aloilla korkeampi, mutta molemmissa on merkittävää vaihtelua.
- Stokastista dominanssia ei välttämättä ole — on kvantiileja, joissa humanistinen ala voi olla parempi.
maailma on jakauma
ja kahta jakaumaa ei voi useinkaan järjestää yksiselitteiseen paremmuusjärjestykseen. Arvoa riippuu siitä, mitä lukijat jakaumalta arvostavat.
12 Lähteet ja huomiot
- Tilastokeskus: Palkkarakenne (PR)
- Eurostat: earn_ses_*, edat_lfse_24
- Vipunen: sijoittumispalvelu
- Mincer, J. (1974). Schooling, Experience and Earnings.
- Koenker, R. (2005). Quantile Regression. CUP.
Metodologinen huomio: palkkajakaumien simulointi perustuu aggregoituihin kvantiileihin. Todelliset yksilötason analyysit vaativat rekisteriaineiston (FOLK + Tulokynsi). Esitetyt luvut ovat suuruusluokissa realistisia mutta eivät tarkkoja pistearvoja.
13 Mitä seuraavaksi?
Osassa 8 tarkastelemme, onko osaamistaso heikentynyt. PISA-trendit, keskeyttämisasteet, arvosanainflaatio — ja se herkkä kysymys: ovatko nuoret aikuiset aikaisempaa heikompia vai paremmin koulutettuja?
Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.