Lahjakkuuden etsimisen sietämätön vaikeus

Talenttiryhmät ovat tulleet urheiluun jäädäkseen. Talenttiryhmissä kaikkein lahjakkaimmilla on mahdollisuus harjoitella parhaassa ohjauksessa muiden lahjakkuuksien kanssa. Tai niin tarina kertoo. Mutta kuinka vakaalla pohjalla lahjakkuuksien eli talenttien tunnistaminen todella seisoo?

Talenttien tunnistamiseen eli seulontaan käytetään seulontatestejä, joiden periaate on yksinkertainen: Otetaan joukko pelaajia, siivilöidään ja poimitaan siivilästä talentit. Ei toki niin, että jokainen siivilään jäävä olisi talentti, mutta toivon mukaan mahdollisimman moni. Osaatko arvioida kuinka moni?

[Toki on varmasti myös ryhmiä, jotka kutsuvat itseään talenttiryhmiksi ilman minkäänlaista seulontaa.]

Kysymys siivilään jäävien talenttien määrästä on olennainen lahjakkuuksien seulonnan kannattavuuden arvioimiseksi. Onhan nimittäin niin, että seulonta kysyy resursseja, ja ilman merkittäviä tuloksia seulontaa ei ehkä kannattaisi tehdä lainkaan. Hyvä uutinen on, että seulonnan lopputulos voidaan melko helposti laskea etukäteen. Tässä jutussa kerron kuinka laskenta suoritetaan.

Oletetaan, että talentin esiintymisen todennäköisyys on aluksi yksi tuhannesta eli 1/1000. Siis missä tahansa tuhannen urheilijan joukossa on yksi talentti. Tämä luku ei ole mikään eksakti fakta. Jos tarkastelee esimerkiksi suomalaisten jalkapalloilijoiden määrää, ja vertaa sitä kansainvälisen uran tehneisiin urheilijoihin, voi helposti todeta, että todennäköisyys on suurempi kuin yksi sadasta tuhannesta ja pienempi kuin yksi sadasta. Ei ole tärkeää onko nyt annettu luku oikein, koska luvun voi vaihtaa, ja katsoa mihin lopputulokseen toisella oletuksella pääsee.

Lähtötilanteessa siis jokaisessa tuhannen juniorin joukossa on yksi talentti, joka tekee kansainvälisen läpimurron aikuisena. Huomaa, että yksi tuhannesta on todennäköisyys. Koska yhdessäkään ryhmässä ei ole tuhatta jäsentä, yhdessäkään ryhmässä ei ole laskennallisesti yhtä kokonaista talenttia. Tarvitaan viisikymmentä kahdenkymmenen urheilijan ryhmää yhden talentin löytämiseen.

Ennen kuin jatkan, on todella tärkeää alleviivata, että lahjakkuuksien seulontatestit eivät ole erehtymättömiä. Mikään seulontatesti ei ole. Esimerkiksi, jos menet syövän seulontatestiin ja saat positiivisen tuloksen (eli testin mukaan sinulla on syöpä), on silti luultavasti todennäköisempää, että sinulla ei ole syöpää. Tätä on aluksi hieman vaikea käsittää, mutta älä huoli, selitän asian alla. Koska seulontatestit siis erehtyvät, ne antavat joskus negatiivisen testituloksen (= ei talentti) sellaiselle pelaajalle, jolle kuuluisi positiivinen tulos (= talentti) ja päinvastoin.

Testin kykyä antaa oikeita tai vääriä positiivisia sekä negatiivisia lopputuloksia kuvataan kahdella luvulla: herkkyys ja tarkkuus. [1]

Herkkyys = todennäköisyys jolla testi antaa positiivisen tuloksen siinä joukossa, jolla on testattava ominaisuus. Seitsemänkymmennen prosentin herkkyys tarkoittaa sitä, että testi löytää seitsemän talenttia kymmenestä.

Tarkkuus = todennäköisyys jolla testi testi antaa negatiivisen tuloksen siinä joukossa, jolla ei ole testattavaa ominaisuutta. Kun tarkkuus on 80 %, testi antaa negatiivisen tuloksen (= ei talentti) kahdeksalle kymmenestä lahjattomasta urheilijasta.

Todennäköisyydet kullekin vaihtoehdolle on esitetty alla olevassa taulukossa. Taulukkoa luetaan niin, että ensimmäisessä sarakkeessa ovat todennäköisyydet silloin, kun testatulla henkilöllä on etsitty ominaisuus ja toisessa sarakkeessa todennäköisyydet silloin, kun etsittyä ominaisuutta ei ole.

Taulukon luvut on mukailtu tutkija Arne Gullichin esityksestä [2], jossa hän käyttää sekä herkkyydelle että tarkkuudelle arvoa 70 %. Poikkesin kuitenkin tästä tavasta hieman ymmärtämisen edistämiseksi: Taulukkoa on helpompi lukea, kun herkkyys ja tarkkuus eivät ole molemmat samoja lukuja.

Taulukko. Herkkyyttä ja tarkkuutta kuvaavat todennäköisyydet.


Ominaisuus on Ominaisuutta ei ole
Positiivinen testitulos 70 % 20 %
Negatiivinen testitulos 30 % 80 %

Herkkyyden ja tarkkuuden avulla alun todennäköisyys (1/1000), jota merkitään P(A), voidaan muuttaa lopun todennäköisyydeksi.

Kutsutaan lopun todennäköisyyttä ehdolliseksi todennäköisyydeksi P(E), koska todennäköisyyttä tarkastellaan sillä ehdolla, että seulonnan tulos on positiivinen.

Ehdollinen todennäköisyys lasketaan Bayesin kaavalla (jota kutsutaan myös Bayesin laiksi, teoreemaksi tai säännöksi). [3]

Ennen kuin kirjoitan Bayesin kaavan, muunnetaan alun todennäköisyys kertoimeksi. Tämä ehkä ärsyttävältä tuntuva toimenpide tehdään siksi, että kertoimella laskeminen on paljon yksinkertaisempaa. Todennäköisyys yksi tuhannesta muunnettuna kertoimeksi on 1:999 — siis yhden suhde 999:än.

Merkitään nyt alun todennäköisyyttä vastaavaa kerrointa A ja ehdollista todennäköisyyttä vastaavaa kerrointa E. Tällöin Bayesin kaavaa noudattaen kirjoitetaan.

E = A * P(+ On) / P(+ Ei ole)

Missä P(+ On) tarkoittaa todennäköisyyttä positiiviselle testitulokselle, kun etsitty ominaisuus on, ja P(+ Ei ole) todennäköisyyttä positiiviselle testitulokselle, kun etsittyä ominaisuutta ei ole.

Sijoitetaan edelliseen yhtälöön arvot taulukon ensimmäiseltä riviltä.

E = 1:999 * (0,7 / 0,2) = 7:1998

Eli positiivisten testitulosten joukossa on seitsemän lahjakasta ja 1998 lahjatonta urheilijaa. Ehdollinen todennäköisyys talentille positiivisen testituloksen jälkeen on talenttien määrä positiivisten testitulosten joukossa jaettuna positiivisten testitulosten kokonaismäärällä.

P(E) = 7 / (7 + 1998) = 0,00349 = 0,35 %

Siispä on vain 0,35 %:n todennäköisyys, että positiivisen testituloksen saanut henkilö todella on talentti.

Tulos on luultavasti vastoin ennakkoluuloja. Kun ihmiset kuulevat, että testin kyky tunnistaa talentti (herkkyys) on 70 %, he odottavat paljon parempaa lopputulosta kuin 0,35 %:n todennäköisyyttä, että talentiksi tunnistettu lopulta yltää terävimmälle huipulle. Virhe ajattelussa tapahtuu silloin siinä, että keskitytään yhteen lukuun, kun pitäisi keskittyä kahteen; pitäisi huomioida myös todennäköisyys lähtötilanteessa. Tälläiset ihmismielen ajattelun vinoumat (systemaattiset virheet) ovat seurausta siitä, että tykkäämme käyttää nopean ajattelun järjestelmää useimpiin päivän mittaan eteen tuleviin ongelmiin. Hitaan ja nopean päättelyjärjestelmän eroista voi lukea Nobel-palkitun Daniel Kahnemanin erinomaisesta kirjasta “Ajattelu hitaasti ja nopeasti”.

Yhteenvetona voidaan sanoa, että talenttien tunnistamisen suurin ongelma ei ole siinä, että testit olisivat huonoja, vaan siinä, että lahjakkuus on äärimmäisen harvinaista.

Aivan lopuksi pieni vinkki. Sain innostuksen tähän blogi-kirjoitukseen suorittaessani Helsingin yliopiston ilmaista tekoälykurssia. [4] Silloin huomasin, että Bayesin kaavan avulla voidaan laskea Gullichin esityksessä esiintyvät luvut. Koska Gullich käyttää sekä herkkyydelle että tarkkuudelle arvoa 70 %, hänen lopputulemansa on 0,2 %:n todennäköisyys (kts. video n. kohdasta 9:45).

Kiitos mielenkiinnostasi!

Lähteet

  1. Sensitivity and specificity (herkkyys ja tarkkuus), viitattu 27.3.2019, wikipedia.com
  2. Gullich: The efficacy of early TID programs in sport, viitattu 27.3.2019, youtube.com
  3. Bayesin teoreema, viitattu 27.3.2019, wikipedia.com
  4. The Elements of AI, ilmainen tekoälykurssi Helsingin yliopistossa, viitattu 27.3.2019.

Jussi Peltonen
My name is Jussi Peltonen.

Leave a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.