Riigieksamite edetabelite metoodika ei ole eriti robustne

Ükskõik millise analüüsi metoodikas on võimalik kahelda, aga üks kasulik küsimus on: kui palju muutuksid tulemused, kui metoodikat veidi muuta?

Postimehe tehtud koolide pingerida riigieksamitulemuste põhjal teeb mitu eeldust, muuhulgas selle, et kõik kolm ainet on võrdse kaaluga (seal on veel mitu subjektiivset otsust, näiteks inglise keele tulemuste arvessevõtmise metoodika, aga jätame nad praegu kõrvale). Mis juhtub, kui varieerime eri ainete kaale?

Võtsin Postimehe tabeli ja simuleerisin 500 korda, milline oleks edetabel, kui võrdsete kaalude asemel kasutame juhuslikke kaale (ühtlane jaotus [0, 1], normaliseeritud nii, et summa oleks konstantne). See peaks näitama, kui robustsed on tulemused variatsioonidele metoodikas.

Graafikul on x-teljel Postimehe järjekorranumber ja y-teljel iga kooli jaoks 500 simuleeritud järjekorranumbrit. Iga joon on üks simulatsioon. Mida rohkem iga kooli simuleeritud järjekorranumber vertikaalselt laiali määritud on, seda rohkem muudab täpne metoodika selle kooli edetabelikohta.

Edetabeli tipp — nii esimesed 5 kohta — eriti ei varieeru. Sealt edasi läheb asi aga kiiresti palju kirjumaks: enamiku koolide koht varieerub u 20 võrra ja mõnel koguni 100 kohta 120-st! (Väga suur variatsioon tekib, kui koolil on üks eksamitulemus erakordselt hea või erakordselt halb võrreldes sama kooli ülejäänud kahe tulemusega.)

Ma ei ütle, et kui eesmärk on koole järjestada, siis see metoodika on täiesti mõttetu. Pigem tahaksin, et selliste pingeridade juures antaks ligikaudne usaldusvahemik, mis küll tihti näeks välja umbes “kool X asub vahemikus 30-80”, aga see annakski õige ettekujutuse edetabeli usaldusväärsusest.

Kust leida usaldusväärset infot?

I

Hiljuti Tartus toimunud tõepõhjahäkatonil arutasin osalejate ja mentoritega küsimust: kuidas leida tõtt? Kui meil on konkreetne küsimus, näiteks “kas kofeiini tarbimine on sinu jaoks hea“, siis kust leiaksime infot, mis oleks täielik ja kallutamata? (Kui tahad laiemat ettekujutust mingist alast, annab head juhised LW artikkel “Scholarship: How to Do It Efficiently“.)

Continue reading

Veidi andmeid asendusteenistusest

Hiljuti oli meedias juttu asendusteenistuse kvaliteedist. Kuna mõtlesin samale teemale paar aastat tagasi palju (enne tervislikel põhjustel vabastuse saamist), on teema mulle hingelähedane.

Seaduse kohaselt saab asendusteenistust läbida asutustes, mis kuuluvad ühte kolmest kategooriast:
a) sotsiaalteenuse osutaja juures, nt hoolde- ja lastekodud, päeva- ja rehabilitatsioonikeskused
b) õppeasutuses, kus on loodud hariduslike erivajadustega õpilaste klassid, nt eriavajadustega õpilaste koolid
c) päästesündmuse lahendamisega tegelevad asutused

Kuna ma ei teadnud kedagi, kes teaks kedagi, kes oleks teenistuse läbinud mõnes päästeasutuses, tahtsin teada, kui paljud on seda teinud. Kaitseressursside amet jagas mulle teabenõude järel lahkelt tabeli kõigi seniste teenistuskohtadega ja seal asendusteenistuse läbinute arvuga. Tuleb välja, et kõik teenistujad on seni olnud a) või b) kategooria asutustes.

See fakt pole kuidagi sisemiselt halb, aga annab ettekujutuse selle kohta, milline asendusteenistus tavaliselt välja näeb. Kui keegi argumenteerib, et “mõtle, kui lahe oleks tuletõrjes töötada” või et päästeasutused on üks võimalik teenistuskoht, saab vastuvaidlemise asemel anda lihtsalt lingi.

Õppeainete mahust, ETH kursustest ja doktorantuurist

Täna oli mu viimane eksam ETH Zürichi arvutiteaduse magistriõppes: homsest alustan magistritöö plaanimist ja kirjanduse uurimist ja eeldatavasti valmib töö septembriks. Teema üldsuund on paigas — safe reinforcement learning ehk ohutu stiimulõpe — aga kirjutan sellest lähemalt, kui plaan selge.

Eksamite lõpu tähistamiseks tegin uuesti graafiku õppeainetele kulunud ajast — avaldasin sama interaktiivse graafiku Tartu ülikooli lõpetades, aga nüüd lisasin ka kõik läbitud ETH kursused.

Continue reading

Mis on hobuse täpne vastand?

Pean nimekirja asjadest, millest tahan kunagi kirjutada. Aeg-ajalt (kord nädalas) võtan sealt ühe teema ja kirjutan postituse, aga mõned küsimused jäävad alati kõrvale, sest tunduvad kas liiga ebaolulised või pisikesed, et omaette postitust vääriks.

Tänane postitus on just sellistest väikestest küsimustest.

  • Miks on isesõitvate autodega maailm parem?
  • Kui hästi Eesti haridussüsteemil läheb?
  • Kas Eesti ilm on objektiivselt halvem kui mujal?
  • Mis juhtuks, kui klooniksin ennast ja kasvataksin klooni üles?
  • Kui eriline on Eesti startup-scene?
  • Mida ei suuda masinõpe/tehisintellekt teha?
  • Mis on hobuse täpne vastand?

Continue reading

Graafikud: Eesti palgajaotus ja palgalõhe

Riigi kodanike palk näitab midagi olulist riigi kohta: näiteks saab iga eestlane võrrelda, kas ta teenib teistest eestlastest rohkem või vähem. Uudistes, raportites ja igasugustes analüüsides räägitakse enamasti keskmisest palgast ja kuigi aritmeetiline keskmine on kõigile selge tõlgendusega arv, ütleb see palgajaotuse kohta väga vähe.1 Paljudes olukordades on keskmise palga vaatamine sama kasutu nagu ütlemine, et keskmisel inimesel on pool peenist ja üks rind.

Milline on siis Eesti palgajaotus? Guugeldades “eesti palgajaotus” on esimene tulemus palgajaotustest, mida tegin Bondora avalikke andmeid analüüsides. Delfi Ärileht on küll natuke kirjutanud keskmise ja mediaani erinevusest, aga täielikku jaotust ei suuda ma internetist leida. Sellepärast teen täna väga lühikese postituse Eesti palgajaotusega, et see oleks kuskil internetis olemas, ja jätan interpreteerimise mõneks teiseks korraks.

Siin ta on (2014. aasta andmetel):

Continue reading