Prioriteedid, Starship ja esinemine tehisintellekti tuleviku teemal

Lisaks informaatikutele peetud ettekandele rääkisin hiljuti sarnasel teemal TTÜs, seekord majandusteaduskonna tudengite kutsel. Karin võttis selle ka linti; rääkisin peamiselt tehisintellekti oodatavast mõjust ühiskonnale ja majandusele.

(video YouTube’is)

Jagan viimasel ajal ettekannete videoid, et natukenegi oma tegemistest ja mõtetest teistega jagada. Blogimine on praegu üsna madala prioriteediga: esikohal on töö Starshipis. Oma elu tagasisaamiseks tegelen praegu intensiivselt outsource’imisega: üritan oma elust eemaldada tegevusi, mida saab veidi raha rakendades kellegi teise kätte anda. Aeg ei ole limiteeriv tegur — paar tundi nädalas leiaksin ikkagi — probleem on pigem tähelepanu, kuna enne magamajäämist/trennis/trollis/jalutades (ehk diffuse režiimis) peas käivaid teemasid ei saa olla eriti palju ning just nendes kohtades tekivad kõige paremad mõtted.

Starship on kõige põnevam pikaajaline projekt, mida ma kunagi teinud olen. Esiteks on robotite ehitamine lahe, teiseks on töö sisuliselt raske ja läheb hästi kokku mu taustaga ja kolmandaks on kõik ümbritsevad inimesed väga heal tasemel. See viimane on natuke stressirohke (ma kirjeldan seda tavaliselt nii, et “kõik mu ümber on oma töös paremad kui mina oma töös, ja 50% neist on minu töös paremad kui mina”), aga samal ajal ka motiveeriv, seega areng on kiire.

Paradoksaalselt: mida rohkem ja põnevamaid ideid mul on, seda vähem on aega neid jagada. Loodan sellegipoolest paari kuu pärast jälle rohkem avaldama hakata — ilmselt peamiselt podcaste, aga ideaalis ka läbimõeldud postitusi.

Ettekanne: andmeteadusest ja masinõppest TÜ informaatikutele

Eelmisel nädalal rääkisin Tartu ülikooli informaatika esmakursuslastele andmeteaduse ja masinõppe põnevusest ja olulisusest. Slaidid leiad siit ja video siit.

Ettekanne tuli üsna hästi välja hoolimata sellest, et peaaegu ainuke teema mu peas viimase kahe kuu jooksul on olnud robotite ehitamine, ja tudengite tagasiside oli päris hea: 154 tudengi tagasiside keskmine hinne oli viiepalliskaalal 4.55.

Minu jaoks põnevaim üksik slaid oli andmeteaduse rollist suures pildis: see peaks aitama jõuda arusaamatust ja mürasest andmekogust selgete ja praktiliste otsusteni.

Riigieksamite edetabelite metoodika ei ole eriti robustne

Ükskõik millise analüüsi metoodikas on võimalik kahelda, aga üks kasulik küsimus on: kui palju muutuksid tulemused, kui metoodikat veidi muuta?

Postimehe tehtud koolide pingerida riigieksamitulemuste põhjal teeb mitu eeldust, muuhulgas selle, et kõik kolm ainet on võrdse kaaluga (seal on veel mitu subjektiivset otsust, näiteks inglise keele tulemuste arvessevõtmise metoodika, aga jätame nad praegu kõrvale). Mis juhtub, kui varieerime eri ainete kaale?

Võtsin Postimehe tabeli ja simuleerisin 500 korda, milline oleks edetabel, kui võrdsete kaalude asemel kasutame juhuslikke kaale (ühtlane jaotus [0, 1], normaliseeritud nii, et summa oleks konstantne). See peaks näitama, kui robustsed on tulemused variatsioonidele metoodikas.

Graafikul on x-teljel Postimehe järjekorranumber ja y-teljel iga kooli jaoks 500 simuleeritud järjekorranumbrit. Iga joon on üks simulatsioon. Mida rohkem iga kooli simuleeritud järjekorranumber vertikaalselt laiali määritud on, seda rohkem muudab täpne metoodika selle kooli edetabelikohta.

Edetabeli tipp — nii esimesed 5 kohta — eriti ei varieeru. Sealt edasi läheb asi aga kiiresti palju kirjumaks: enamiku koolide koht varieerub u 20 võrra ja mõnel koguni 100 kohta 120-st! (Väga suur variatsioon tekib, kui koolil on üks eksamitulemus erakordselt hea või erakordselt halb võrreldes sama kooli ülejäänud kahe tulemusega.)

Ma ei ütle, et kui eesmärk on koole järjestada, siis see metoodika on täiesti mõttetu. Pigem tahaksin, et selliste pingeridade juures antaks ligikaudne usaldusvahemik, mis küll tihti näeks välja umbes “kool X asub vahemikus 30-80”, aga see annakski õige ettekujutuse edetabeli usaldusväärsusest.

Magistritöö post mortem

Mu magistriõpe ETH Zürichis kulmineerus magistritööga, mis omakorda lõppes töö kaitsmisega veidi enam kui kaks nädalat tagasi. Juhendan sel õppeaastal ise kaht lõputööd, mis annab mulle pildi vorstitegemisest teiselt poolt liini, seega jagan enne unustamist lühidalt, mida ma kogu protsessi käigus õppisin, ja loodan, et sellest on kasu tulevastele baka- ja magistritöötajatele.

Continue reading

Kas skandaal mõjutas Taavi Rõivase häälesaaki valimistel?

Tänane postitus on külalispostitus: autoriteks on Kadri Pungas ja Taavi Pungas.

Eelmisel nädalal sattusid huvitava ajastusega järjestikku mõned sündmused:

  • KOV valimiste eelhääletamine, sh e-hääletamine – kestis kolmapäeval kuni 18:00-ni.
  • Pommuudis meedias Taavi Rõivase nn Malaisia skandaali kohta – avaldati neljapäeva varahommikul, diskussioon jätkus elavalt veel mitmeid päevi.
  • KOV valimiste valimispäev – pühapäev.

Inimeste valimisotsuseid potentsiaalselt oluliselt mõjutav skandaal ilmus meedias pärast e-hääletamise lõppu, aga enne paberhääletamist valimispäeval. Teisisõnu ei saanud skandaal e-hääli mitte kuidagi mõjutada, samas kui Taavi Rõivasele antud paberhäältest peaks skandaali põhjustatud mainekahju juba välja paistma.1 Tänu Vabariigi Valimiskomisjoni lahkusele andmete avaldamisel on e-hääletamise tulemus paberhäältest eristatav, seega on võimalik kontrollida, kui palju hääli sai “skandaalne Taavi Rõivas” mainekahju tõttu vähem kui “tavaline Taavi Rõivas”.

Continue reading

Uus podcast: 20midagi

Inimesed, kes on oma ala tipus, on tavaliselt vanuses 40-60, mõnikord harva ka kolmekümnendates. Meedia teeb nendega intervjuusid ja katab nende tegemisi, aga jätab tähelepanuta teise põneva grupi inimesi: noored, kes teevad ägedaid asju, aga kes pole veel piisavalt kaua töötanud, et olla tippu jõudnud.

Panin tähele, et mu tuttavate hulgas on palju selliseid kahekümnendates noori ja otsustasin olukorra muutmiseks midagi ette võtta. 20midagi on uus podcast, kus räägin just selliste inimestega: noorte tulevaste maailmamuutjatega. Üritan aru saada nende mõttemallidest, motivatsioonist, edu valemist ja paljust muust. Podcasti veebileht on 20midagi.ee ja sealt leiab lingid iTunesi, YouTube’i ja podcasti sotsiaalmeedia lehtedele. Visuaalselt näeb ta välja selline:

Esimeses saates rääkisin Heiki Riesenkampfiga järgmistest teemadest:

  • Mis on tootejuhtimine, mida teeb tootejuht (product manager) Google’i skaalal ja mis teeb selle töö raskeks?
  • Mida teha, kui tahad teha leivatootmisettevõtet ja oled jõudnud punkti, kus sul on garaažis euroalusetäis leiba?
  • Miks tasub aatomite maailmas tegutsedes uurida välja, kas kellelgi on su toodet vaja?
  • Kuidas ainult ühe teema õppimisele spetsialiseerumine võib kahjulik olla – nii keskkoolis kui ülikoolis?
  • Kuidas välisülikoolis õppimine ja välismaal õppimine annab motivatsiooni suuri asju ellu viia?
  • Miks ei tasu end lasta häirida asjadest, mis on su kontrolli alt väljas?
  • Miks Heiki piirab enda sotsiaalmeedia kasutust?
  • Mida võiks Eestis teistmoodi teha?

Loodan, et peate neid vestlusi sama põnevaks kui mina. Heameelega kuulan, mida episoodidest arvasite — kirjutage!

Sissejuhatus andmeteadusse

Terve suve on minu poolt postituste põud olnud. Ühelt poolt olen keskendunud magistritööle (tähtaeg on septembri lõpus), aga veel suurem põhjus on olnud Data Science Estonia.

Nimelt kirjutasin koos paari teise panustajaga datasci.ee lehele 7-osalise postituste seeria “Sissejuhatus andmeteadusse” — soovitan seda lühidalt vaadata ja kui praegu lugeda ei jõua, siis meilile tellida.

Lisaks sellele olen organiseerinud üritusi seeriast Ülikoolist andmeteadusse, mille eesmärk on tuua erinevate erialade tudengitele rääkima sama taustaga andmeteadlane, kes siis räägiks oma põhjustest ja teekonnast andmeteadusse minekul. Esimene üritus toimus septembri alguses Tartus, teine toimub samas juba sel reedel ja kolmandat plaanime oktoobriks Tallinnasse. Videod, slaidid ja tulevaste ürituste lingid leiad datasci.ee/meetup.

Kolmas põhjus, miks vähem kirjutan, ongi minu jaoks veidi asendus blogimisele. Tulen sellega välja ilmselt oktoobri alguses, aga tehniliselt on ta juba praegu avalikult kättesaadav — pead lihtsalt oskama otsida. Kindlasti annan ka blogis ja meililistis teada, kui projekt avapaugu saab; jää ootama!

Head ja halvad mudelid

Kalev teavitas hiljuti avalikkust, et mingi muudatuse tõttu tootmisliinides võivad teatud tooted hakata sisaldama maapähklite jääke. Firma pani teavituse üles ka oma Facebooki lehele, mille all siis mõned pettunud inimesed kommenteerisid stiilis “Kalev kaotab nüüd palju kliente” ja “miks kõik asjad peavad olema ära rikutud”.

USA-s on pähklitele allergilised 0.6% inimestest; eeldatavasti Eestis umbes samapalju. Oletame, et 2017. aastal on Kalevil kaks varianti: a) teha kõik tooted pähklijääkidevabaks ja sihtida 100% turust või b) kasutada samu liine pähkliga ja pähklita maiuste tootmiseks ning sihtida 99.4% turust.

Kui eeldada, et Kalev on nagu vastutustundlik ja hooliv vanem, kes tahab kogu riigile head, valib ta ilmselgelt variandi a. Me ei tohiks ju jätta kõrvale inimesi lihtsalt sellepärast, et neil on (tahtlikule kontrollile allumatu) allergia?

Continue reading

Kõik Eesti taskuhäälingud ehk podcastid

2021: Eesti podcastid lehel leiad kõige värskema ülevaate Eesti podcastidest.

Tegin Facebooki abiga nimekirja kõigist eestikeelsetest taskuhäälingutest (ingl k podcast). Kui midagi on puudu, anna teada.

(Raadiosaateid ei hakanud ma eraldi välja tooma; need leiad vastava raadio lingi alt. Mitteaktiivsetest podcastidest hoolin siin vähem, aga andke link ja lisan nimekirja ikkagi.)

Taskuhäälingud

Raadiod

Mitteaktiivsed taskuhäälingud

Plaanin varsti naasta veidi tihedama postitamisgraafiku juurde, aga niikaua soovitan jälgida mind Facebookis — kirjutan seal tihemini lühikesi mõtteid või jagan endale põnevaid artikleid. (Muide, olen ka Instagramis ja üritan Instagrami keskmist kvaliteeti tõsta.)