Kuidas läheb?

Oled lehel, mis räägib andmeteadusest, iseenda õpetamisest, igapäevaelust ja kõigest muust. Enamasti kõigest muust.

Loe minust ja blogist lähemalt siit, või loe:

Et saada uute postituse kohta esimesena teada, liitu meililistiga:

Riigieksamite edetabelite metoodika ei ole eriti robustne

Ükskõik millise analüüsi metoodikas on võimalik kahelda, aga üks kasulik küsimus on: kui palju muutuksid tulemused, kui metoodikat veidi muuta?

Postimehe tehtud koolide pingerida riigieksamitulemuste põhjal teeb mitu eeldust, muuhulgas selle, et kõik kolm ainet on võrdse kaaluga (seal on veel mitu subjektiivset otsust, näiteks inglise keele tulemuste arvessevõtmise metoodika, aga jätame nad praegu kõrvale). Mis juhtub, kui varieerime eri ainete kaale?

Võtsin Postimehe tabeli ja simuleerisin 500 korda, milline oleks edetabel, kui võrdsete kaalude asemel kasutame juhuslikke kaale (ühtlane jaotus [0, 1], normaliseeritud nii, et summa oleks konstantne). See peaks näitama, kui robustsed on tulemused variatsioonidele metoodikas.

Graafikul on x-teljel Postimehe järjekorranumber ja y-teljel iga kooli jaoks 500 simuleeritud järjekorranumbrit. Iga joon on üks simulatsioon. Mida rohkem iga kooli simuleeritud järjekorranumber vertikaalselt laiali määritud on, seda rohkem muudab täpne metoodika selle kooli edetabelikohta.

Edetabeli tipp — nii esimesed 5 kohta — eriti ei varieeru. Sealt edasi läheb asi aga kiiresti palju kirjumaks: enamiku koolide koht varieerub u 20 võrra ja mõnel koguni 100 kohta 120-st! (Väga suur variatsioon tekib, kui koolil on üks eksamitulemus erakordselt hea või erakordselt halb võrreldes sama kooli ülejäänud kahe tulemusega.)

Ma ei ütle, et kui eesmärk on koole järjestada, siis see metoodika on täiesti mõttetu. Pigem tahaksin, et selliste pingeridade juures antaks ligikaudne usaldusvahemik, mis küll tihti näeks välja umbes “kool X asub vahemikus 30-80”, aga see annakski õige ettekujutuse edetabeli usaldusväärsusest.

Magistritöö post mortem

Mu magistriõpe ETH Zürichis kulmineerus magistritööga, mis omakorda lõppes töö kaitsmisega veidi enam kui kaks nädalat tagasi. Juhendan sel õppeaastal ise kaht lõputööd, mis annab mulle pildi vorstitegemisest teiselt poolt liini, seega jagan enne unustamist lühidalt, mida ma kogu protsessi käigus õppisin, ja loodan, et sellest on kasu tulevastele baka- ja magistritöötajatele.

Continue reading

Kas skandaal mõjutas Taavi Rõivase häälesaaki valimistel?

Tänane postitus on külalispostitus: autoriteks on Kadri Pungas ja Taavi Pungas.

Eelmisel nädalal sattusid huvitava ajastusega järjestikku mõned sündmused:

  • KOV valimiste eelhääletamine, sh e-hääletamine – kestis kolmapäeval kuni 18:00-ni.
  • Pommuudis meedias Taavi Rõivase nn Malaisia skandaali kohta – avaldati neljapäeva varahommikul, diskussioon jätkus elavalt veel mitmeid päevi.
  • KOV valimiste valimispäev – pühapäev.

Inimeste valimisotsuseid potentsiaalselt oluliselt mõjutav skandaal ilmus meedias pärast e-hääletamise lõppu, aga enne paberhääletamist valimispäeval. Teisisõnu ei saanud skandaal e-hääli mitte kuidagi mõjutada, samas kui Taavi Rõivasele antud paberhäältest peaks skandaali põhjustatud mainekahju juba välja paistma.1 Tänu Vabariigi Valimiskomisjoni lahkusele andmete avaldamisel on e-hääletamise tulemus paberhäältest eristatav, seega on võimalik kontrollida, kui palju hääli sai “skandaalne Taavi Rõivas” mainekahju tõttu vähem kui “tavaline Taavi Rõivas”.

Continue reading

Uus podcast: 20midagi

Inimesed, kes on oma ala tipus, on tavaliselt vanuses 40-60, mõnikord harva ka kolmekümnendates. Meedia teeb nendega intervjuusid ja katab nende tegemisi, aga jätab tähelepanuta teise põneva grupi inimesi: noored, kes teevad ägedaid asju, aga kes pole veel piisavalt kaua töötanud, et olla tippu jõudnud.

Panin tähele, et mu tuttavate hulgas on palju selliseid kahekümnendates noori ja otsustasin olukorra muutmiseks midagi ette võtta. 20midagi on uus podcast, kus räägin just selliste inimestega: noorte tulevaste maailmamuutjatega. Üritan aru saada nende mõttemallidest, motivatsioonist, edu valemist ja paljust muust. Podcasti veebileht on 20midagi.ee ja sealt leiab lingid iTunesi, YouTube’i ja podcasti sotsiaalmeedia lehtedele. Visuaalselt näeb ta välja selline:

Esimeses saates rääkisin Heiki Riesenkampfiga järgmistest teemadest:

  • Mis on tootejuhtimine, mida teeb tootejuht (product manager) Google’i skaalal ja mis teeb selle töö raskeks?
  • Mida teha, kui tahad teha leivatootmisettevõtet ja oled jõudnud punkti, kus sul on garaažis euroalusetäis leiba?
  • Miks tasub aatomite maailmas tegutsedes uurida välja, kas kellelgi on su toodet vaja?
  • Kuidas ainult ühe teema õppimisele spetsialiseerumine võib kahjulik olla – nii keskkoolis kui ülikoolis?
  • Kuidas välisülikoolis õppimine ja välismaal õppimine annab motivatsiooni suuri asju ellu viia?
  • Miks ei tasu end lasta häirida asjadest, mis on su kontrolli alt väljas?
  • Miks Heiki piirab enda sotsiaalmeedia kasutust?
  • Mida võiks Eestis teistmoodi teha?

Loodan, et peate neid vestlusi sama põnevaks kui mina. Heameelega kuulan, mida episoodidest arvasite — kirjutage!

Sissejuhatus andmeteadusse

Terve suve on minu poolt postituste põud olnud. Ühelt poolt olen keskendunud magistritööle (tähtaeg on septembri lõpus), aga veel suurem põhjus on olnud Data Science Estonia.

Nimelt kirjutasin koos paari teise panustajaga datasci.ee lehele 7-osalise postituste seeria “Sissejuhatus andmeteadusse” — soovitan seda lühidalt vaadata ja kui praegu lugeda ei jõua, siis meilile tellida.

Lisaks sellele olen organiseerinud üritusi seeriast Ülikoolist andmeteadusse, mille eesmärk on tuua erinevate erialade tudengitele rääkima sama taustaga andmeteadlane, kes siis räägiks oma põhjustest ja teekonnast andmeteadusse minekul. Esimene üritus toimus septembri alguses Tartus, teine toimub samas juba sel reedel ja kolmandat plaanime oktoobriks Tallinnasse. Videod, slaidid ja tulevaste ürituste lingid leiad datasci.ee/meetup.

Kolmas põhjus, miks vähem kirjutan, ongi minu jaoks veidi asendus blogimisele. Tulen sellega välja ilmselt oktoobri alguses, aga tehniliselt on ta juba praegu avalikult kättesaadav — pead lihtsalt oskama otsida. Kindlasti annan ka blogis ja meililistis teada, kui projekt avapaugu saab; jää ootama!

Head ja halvad mudelid

Kalev teavitas hiljuti avalikkust, et mingi muudatuse tõttu tootmisliinides võivad teatud tooted hakata sisaldama maapähklite jääke. Firma pani teavituse üles ka oma Facebooki lehele, mille all siis mõned pettunud inimesed kommenteerisid stiilis “Kalev kaotab nüüd palju kliente” ja “miks kõik asjad peavad olema ära rikutud”.

USA-s on pähklitele allergilised 0.6% inimestest; eeldatavasti Eestis umbes samapalju. Oletame, et 2017. aastal on Kalevil kaks varianti: a) teha kõik tooted pähklijääkidevabaks ja sihtida 100% turust või b) kasutada samu liine pähkliga ja pähklita maiuste tootmiseks ning sihtida 99.4% turust.

Kui eeldada, et Kalev on nagu vastutustundlik ja hooliv vanem, kes tahab kogu riigile head, valib ta ilmselgelt variandi a. Me ei tohiks ju jätta kõrvale inimesi lihtsalt sellepärast, et neil on (tahtlikule kontrollile allumatu) allergia?

Continue reading

Kõik Eesti taskuhäälingud ehk podcastid

Tegin Facebooki abiga nimekirja kõigist eestikeelsetest taskuhäälingutest (ingl k podcast). Kui midagi on puudu, anna teada.

(Raadiosaateid ei hakanud ma eraldi välja tooma; need leiad vastava raadio lingi alt. Mitteaktiivsetest podcastidest hoolin siin vähem, aga andke link ja lisan nimekirja ikkagi.)

Taskuhäälingud

Raadiod

Mitteaktiivsed taskuhäälingud

Plaanin varsti naasta veidi tihedama postitamisgraafiku juurde, aga niikaua soovitan jälgida mind Facebookis — kirjutan seal tihemini lühikesi mõtteid või jagan endale põnevaid artikleid. (Muide, olen ka Instagramis ja üritan Instagrami keskmist kvaliteeti tõsta.)

Kogumikud

Paljud mu postitused tutvustavad mingit teemat jupikaupa, mistõttu on neid parim lugeda järjestuses. Allpool on minu soovitatud järjekord paari olulisema teema lugemiseks. Siin on vähem kui pooled postitused; kõiki postitusi saad kõige paremini uurida märksõnade kaupa.

Kuidas olla rohkem: alused

  1. Miks hoolida enesearengust?
  2. Süsteem 1 ja Süsteem 2
  3. Tõenäosustes mõtlemine
  4. Ebaõnnestumine
  5. Harjumused ja päästik/samm-mustrid
  6. Suhtlemine kui omandatav oskus
  7. Asendustegevused
  8. Diivanikartullus
  9. Lase andmetel oma meelt muuta

Kuidas olla rohkem: konkreetsed soovitused

  1. Algoritm värgi ärategemiseks
  2. Eneseareng I: Motivatsioon
  3. Eneseareng II: kuidas olla vaimses tippvormis
  4. Eneseareng III: tööriistad produktiivsuse tõstmiseks
  5. Valikute tegemine: kolm põhimõtet
  6. Tugev suhtlusvõrgustik on universaalne kindlustus
  7. Kust leida usaldusväärset infot?
  8. Esinemishirmuga toimetulemine
  9. “Ma pean” ei ole argument

Masinõpe ja andmeteadus

  1. Mõisted: masinõpe vs tehisintellekt vs suurandmed vs andmeteadus
  2. Masinõpe: mittetehniline ülevaade
  3. Kolm põhireeglit graafikute tegemiseks

Õnnelikkus

  1. Õnnelikkuse ja saavutamise vastuolu
  2. Õnn on heaolu varieeruvus
  3. Asjade ja kogemuste tagajamine

Haridus

  1. Lahendus Eesti kooli probleemile
  2. Erialavalik ülikoolis
  3. Programmeerimine kui igapäevane tegevus