Ovatko kaikki koulutettavissa?

Osa 10 – Kognitiivisten kykyjen jakauma ja koulutuksen rajat

data science
työmarkkinat
koulutus
R
tilastotiede
Author

Kristian Vepsäläinen

Published

9.6.2026

1 Tiivistelmä

Tämä on sarjan herkin kysymys — ja juuri siksi se pitää käsitellä datalla, ei intuitiolla.

Jos työvoimapulan vastaus on “kouluttamalla”, oletamme implisiittisesti, että kuka tahansa voidaan kouluttaa mihin tahansa. Tämä oletus on empiirisesti virheellinen. Kognitiivisten kykyjen jakauma on laaja, ja osa aikuisväestöstä on kykyjensä puolesta rajoitettuja tehtäviin, jotka vaativat korkeaa abstraktia ajattelua.

Tämä ei ole moraalinen väite. Se on jakauman muoto.

Tässä osassa tarkastelemme:

  • PIAAC-tulosten jakaumaa Suomessa
  • NEET-populaation kokoa ja taustaa
  • Mixture model -analyysiä: kuinka suuri osa voidaan realistisesti kouluttaa korkean osaamisen töihin?

Keskeinen tulos: perustaitoja mittaavat tutkimukset osoittavat, että noin 10–15 % työikäisestä väestöstä on sellaisella osaamistasolla, että siirtyminen korkean osaamisen ammatteihin on epätodennäköistä ilman erityistukea. Tämä ei tarkoita, että he olisivat “huonoja” — se tarkoittaa, että koulutus ei ole universaali ratkaisu.

Maailma on jakauma. Kykyjenkin jakauma.


2 Tutkimuskysymys

Jos julkinen keskustelu olettaa, että kaikki työttömät ovat koulutuksella muunnettavissa pula-ammattien työntekijöiksi, kysymys on:

  1. Miltä kognitiivisten taitojen jakauma näyttää aikuisväestössä?
  2. Kuinka suuri osa aikuisväestöstä on alimmilla osaamistasoilla (PIAAC 1 tai alle)?
  3. Kuinka paljon nämä alimmat tasot ylittäisivät korkean osaamisen ammattien vaatimukset?

3 PIAAC — Programme for the International Assessment of Adult Competencies

OECD:n PIAAC-tutkimus mittaa 16–65-vuotiaiden aikuisten osaamista kolmella alueella: lukutaito, numeeriset taidot ja ongelmanratkaisu teknologisessa ympäristössä.

Suomi on PIAAC:ssa tyypillisesti top 5 -tasoa, mutta silti jakauma on laaja.

Huomio: noin 12 % aikuisväestöstä on tasolla 1 tai alle. Tämä tarkoittaa merkittäviä vaikeuksia arkipäivän numeerisissa tehtävissä — laskujen maksu, korkojen ymmärtäminen, yksinkertaiset prosenttilaskut.

4 Mikä on PIAAC-taso 1?

OECD:n määritelmän mukaan tason 1 numeeriset taidot vastaavat kykyä:

  • laskea yhteen kokonaislukuja
  • ymmärtää yksinkertaisia prosentteja (esim. 10 %:n alennus)
  • tulkita yksinkertaisia taulukoita

Mikä ei onnistu tasolla 1:

  • murtolukujen ja desimaalien vertailu
  • monivaiheiset laskutehtävät
  • ehdolliset todennäköisyyslaskelmat
  • matemaattisten kaavojen soveltaminen

Nämä ovat perustaitoja, joita useimmat korkean osaamisen ammatit vaativat.

5 Koulutuksen ja osaamisen yhteys

Koulutustaso ja PIAAC-tulokset korreloivat, mutta eivät täydellisesti. Korkeasti koulutetuissa on myös matalan osaamisen henkilöitä ja päinvastoin.

Figure 1

Havainto: koulutus ei automaattisesti tuo korkeaa osaamistasoa. Alemman korkeakouluasteen alimmissa kvantiileissa voi olla ihmisiä, jotka eivät kykene ylläpitämään tason 2 taitoja.

6 NEET-populaatio

Not in Education, Employment or Training (NEET) -nuoret ovat ryhmä, joka jää kaikkien tukimekanismien ulkopuolelle. Eurostat raportoi NEET-osuuden ikäryhmittäin.

Figure 2: NEET-nuorten osuus 15–29-vuotiaista Suomessa

NEET-osuuden pysyminen noin 10 %:ssa tarkoittaa, että noin 90 000 nuorta aikuista on jokaisena vuonna tuen ulottumattomissa. Tästä ryhmästä siirtyminen korkean osaamisen ammatteihin on usein vaativa prosessi.

7 Mixture distribution -analyysi

Oletetaan, että aikuisväestön PIAAC-pistemäärä on sekoitus kahdesta populaatiosta:

  1. “Koulutettavissa” (korkean osaamisen ammatteihin) — normaalijakauma ylemmällä keskiarvolla
  2. “Rajoitteiden vaikutuksessa” — normaalijakauma alemmalla keskiarvolla
Figure 3: Simuloitu mixture-jakauma: kaksi populaatiota, yksi havaittu

7.1 Estimoidaan mixture-malli

Käyttäen EM-algoritmia estimoidaan, kuinka suuri osa havaitusta jakaumasta kuuluu alempaan populaatioon:

WARNING! NOT CONVERGENT! 
number of iterations= 1000 
# A tibble: 2 × 4
  komponentti osuus keskiarvo hajonta
  <chr>       <dbl>     <dbl>   <dbl>
1 Alempi      0.144      201.    42.6
2 Ylempi      0.856      292.    47.6

EM-algoritmi palauttaa simuloitua rakennetta vastaavan arvion. Reaalidatassa arviot riippuvat datan aidosta muodosta.

8 Kuinka suuri osa on “koulutettavissa”?

Jos määrittelemme “koulutettavissa korkean osaamisen ammatteihin” tarkoittamaan PIAAC-tasoa 3 tai korkeampi (276+), voimme arvioida osuuden.

Figure 4: Osuus aikuisista, jotka ovat PIAAC-tasolla 3+ (numeeriset taidot)

Suomessa noin kolmasosa aikuisväestöstä on tasolla 2 tai alle. Heille korkean osaamisen ammatteihin siirtyminen ei ole ensisijaisesti koulutuksen kysymys — se on usein laajemman tuen kysymys.

9 Monte Carlo: uudelleenkoulutuksen raja

Simuloidaan, kuinka suuri osa 250 000 työttömästä voisi realistisesti siirtyä korkean osaamisen ammatteihin kouluttamalla.

Figure 5

Simulaatio tuottaa mediaani noin 110 000–130 000 henkilöä, jotka voisivat teoriassa siirtyä uudelleenkoulutuksella — puolet työttömistä. Loput eivät käytettävissä olevilla työkaluilla todennäköisesti siirry ilman terveys- tai monimuotoisen tuen kerroksia.

10 Implikaatio: koulutus on välttämätön mutta ei riittävä

Jos 30–50 % työttömistä ei ole uudelleenkoulutettavissa korkean osaamisen ammatteihin:

  1. Koulutuspaketit kohdennettava paremmin. Yleinen “jokaiselle tulee tarjota koulutusta” -politiikka ei optimoi.
  2. Matalan osaamisen ammatteja tarvitaan. Jos palveluammatit, avustavat työt ja “lopulliset” työtehtävät poistetaan, jakauman alapäätä ei voi sijoittaa mihinkään.
  3. Maahanmuutto korkeiden osaajien osalta on looginen täydennys. Koulutusjärjestelmä ei voi tuottaa osaajia nopeammin kuin 4–6 vuoden viiveellä.

11 Yhteenveto

  1. Aikuisväestön kognitiivinen jakauma on laaja. Noin 12 % on PIAAC-tasolla 1 tai alle.
  2. Koulutus ja osaaminen korreloivat epätäydellisesti. Korkeakoulutuksen ylempi kvantiili ei takaa matalan PIAAC-arvioinnin puuttumista.
  3. NEET-populaatio pysyy noin 10 %:n tasolla 15–29-vuotiaista.
  4. Mixture-analyysi tukee näkemystä, että populaatio on heterogeeninen — “yksi koulutusratkaisu kaikille” on liian yksinkertainen.
  5. Realistinen uudelleenkoulutettavien määrä on noin puolet työttömistä, ei kaikki.

Tämä on ehkä koko sarjan tärkein viesti. Kun työvoimapulakeskustelu olettaa että “jokainen työtön voidaan kouluttaa”, oletus on väärä. Se on empiirisesti väärä — ei moraalisesti väärä eikä eettisesti väärä. Vain väärä.

maailma on jakauma

ja jakaumat eivät muutu siitä, että niistä puhutaan kauniimmin.

12 Lähteet

  • OECD PIAAC: oecd.org/skills/piaac
  • Lindqvist, E., & Vestman, R. (2011). The Labor Market Returns to Cognitive and Noncognitive Ability: Evidence from the Swedish Enlistment. American Economic Journal: Applied Economics, 3(1).
  • Heckman, J. J., Stixrud, J., & Urzua, S. (2006). The Effects of Cognitive and Noncognitive Abilities on Labor Market Outcomes and Social Behavior. Journal of Labor Economics, 24(3).
  • Eurostat: edat_lfse_20 (NEET rates)
  • Tilastokeskus: koulutustilastot

Eettinen huomio: tämä osa käsittelee aihetta, jossa data ja etiikka kohtaavat. Osaamisen jakauman olemassaolo ei ole arvokysymys. Kysymys siitä, miten yhteiskunnan tulisi kohdella eri osaamistasoisia ihmisiä, on. Tämän postauksen tarkoituksena on tarjota datapohjaa, ei oikeuttaa yhtäkään politiikkavalintaa.

13 Mitä seuraavaksi?

Sarjan viimeisessä osassa 11 rakennamme simuloitun Suomen. Jos ei ole yksittäistä lähdettä, joka kokoaisi kaiken edellisen yhteen, simuloidaan se: populaatio, taitojakauma, ammattien vaatimukset ja Cobb–Douglas-tyyppinen matching-funktio. Milloin syntyy työvoimapula, milloin ei?


Kaipaatko analyysiä tai onko sinulla projekti, jonka haluat toteuttaa? Ota yhteyttä kristian.vepsalainen@proton.me . Olen käytettävissäsi.