Kuidas läheb?

Oled lehel, mis räägib andmeteadusest, iseenda õpetamisest, igapäevaelust ja kõigest muust. Enamasti kõigest muust.

Loe minust ja blogist lähemalt siit, või loe:

Et saada uute postituse kohta esimesena teada, liitu meililistiga:

Tim Ferrisse 11 küsimust

Tean Tim Ferrisse raamatuid (nt “The 4-Hour Workweek“) ja podcasti juba päris kaua, aga millegipärast oli mul temast negatiivne eelarvamus kujunenud. Nüüd otsustasin võtta kätte tema uusima raamatu “Tribe of Mentors”, mis koosneb 100+ inimese vastustest 11 eri küsimusele. Need küsimused on väga head ja ma plaanin need 20midagi ja oma eravestluste jaoks varastada, aga tahan enne neile ise vastata. Olen küsimused siin (väikeste kohandustega) eesti keelde tõlkinud; originaalid koos raamatu sissejuhatusega leiad siit.

Continue reading

Uue aasta avalikud algusmõtted

Kuna ma ei prioriseeri praegu sügavate blogipostituste tegemist väga kõrgelt, jagan siin edasi oma mujal tehtud tegevusi ja mõeldud mõtteid.

North Star AI konverents Tallinnas 8. märtsil

Eesti masinõppe ja andmeteaduse kommuunid on omavahel üsna hästi tuttavad — enamik praktiseerijaid on juba kuskil ettekande või paar teinud. Selleks, et ühendada Eesti kommuuni rohkem ülejäänud maailmaga, korraldame konverentsi North Star AI, kus räägitakse tehisintellekti praktilistest rakendustest. Esimese aasta kohta on konverentsi tase ülikõrge.

Enamik spetsialiste ja huvilisi Eestist (ja palju ka lähiriikidest) on konverentsil kohal — üritus on hea võimalus nendega kohtumiseks. Piletid, kava jm info veebilehelt.

Video Kariniga vähem hoolimisest

Mulle tundub, et enamik inimesi hoolivad liiga palju mõttetutest asjadest. Allolevas videos arutame seda Kariniga (14min).

Tehnoloogia, tulevik ja karjäärisoovitused noortele

Tartu kõrgkoolid korraldasid üritust Õpi Tartus, kus rääkisin peamiselt keskkoolinoortele sellest, kuidas arvutite aina laiem levik ja targemaksmuutumine nende karjääriplaane võiks mõjutada. Slaidid leiad siit.

Sama ürituse eel avaldas Novaator minuga lühikese intervjuu sarnastel teemadel.

Produktiivsuse piirid

Kolleeg püstitas hiljuti küsimuse: mis on maksimaalne saavutatav produktiivsus ühe päeva jooksul? Ma ei osanud kohe head vastust anda, seega kirjutan nüüd põhjalikumalt. Täpsemalt tahame teada, kui palju produktiivseid tunde saab päevas ja nädalas olla, et näiteks viie aasta jooksul läbi ei põle.

Continue reading

Prioriteedid, Starship ja esinemine tehisintellekti tuleviku teemal

Lisaks informaatikutele peetud ettekandele rääkisin hiljuti sarnasel teemal TTÜs, seekord majandusteaduskonna tudengite kutsel. Karin võttis selle ka linti; rääkisin peamiselt tehisintellekti oodatavast mõjust ühiskonnale ja majandusele.

(video YouTube’is)

Jagan viimasel ajal ettekannete videoid, et natukenegi oma tegemistest ja mõtetest teistega jagada. Blogimine on praegu üsna madala prioriteediga: esikohal on töö Starshipis. Oma elu tagasisaamiseks tegelen praegu intensiivselt outsource’imisega: üritan oma elust eemaldada tegevusi, mida saab veidi raha rakendades kellegi teise kätte anda. Aeg ei ole limiteeriv tegur — paar tundi nädalas leiaksin ikkagi — probleem on pigem tähelepanu, kuna enne magamajäämist/trennis/trollis/jalutades (ehk diffuse režiimis) peas käivaid teemasid ei saa olla eriti palju ning just nendes kohtades tekivad kõige paremad mõtted.

Starship on kõige põnevam pikaajaline projekt, mida ma kunagi teinud olen. Esiteks on robotite ehitamine lahe, teiseks on töö sisuliselt raske ja läheb hästi kokku mu taustaga ja kolmandaks on kõik ümbritsevad inimesed väga heal tasemel. See viimane on natuke stressirohke (ma kirjeldan seda tavaliselt nii, et “kõik mu ümber on oma töös paremad kui mina oma töös, ja 50% neist on minu töös paremad kui mina”), aga samal ajal ka motiveeriv, seega areng on kiire.

Paradoksaalselt: mida rohkem ja põnevamaid ideid mul on, seda vähem on aega neid jagada. Loodan sellegipoolest paari kuu pärast jälle rohkem avaldama hakata — ilmselt peamiselt podcaste, aga ideaalis ka läbimõeldud postitusi.

Ettekanne: andmeteadusest ja masinõppest TÜ informaatikutele

Eelmisel nädalal rääkisin Tartu ülikooli informaatika esmakursuslastele andmeteaduse ja masinõppe põnevusest ja olulisusest. Slaidid leiad siit ja video siit.

Ettekanne tuli üsna hästi välja hoolimata sellest, et peaaegu ainuke teema mu peas viimase kahe kuu jooksul on olnud robotite ehitamine, ja tudengite tagasiside oli päris hea: 154 tudengi tagasiside keskmine hinne oli viiepalliskaalal 4.55.

Minu jaoks põnevaim üksik slaid oli andmeteaduse rollist suures pildis: see peaks aitama jõuda arusaamatust ja mürasest andmekogust selgete ja praktiliste otsusteni.

Riigieksamite edetabelite metoodika ei ole eriti robustne

Ükskõik millise analüüsi metoodikas on võimalik kahelda, aga üks kasulik küsimus on: kui palju muutuksid tulemused, kui metoodikat veidi muuta?

Postimehe tehtud koolide pingerida riigieksamitulemuste põhjal teeb mitu eeldust, muuhulgas selle, et kõik kolm ainet on võrdse kaaluga (seal on veel mitu subjektiivset otsust, näiteks inglise keele tulemuste arvessevõtmise metoodika, aga jätame nad praegu kõrvale). Mis juhtub, kui varieerime eri ainete kaale?

Võtsin Postimehe tabeli ja simuleerisin 500 korda, milline oleks edetabel, kui võrdsete kaalude asemel kasutame juhuslikke kaale (ühtlane jaotus [0, 1], normaliseeritud nii, et summa oleks konstantne). See peaks näitama, kui robustsed on tulemused variatsioonidele metoodikas.

Graafikul on x-teljel Postimehe järjekorranumber ja y-teljel iga kooli jaoks 500 simuleeritud järjekorranumbrit. Iga joon on üks simulatsioon. Mida rohkem iga kooli simuleeritud järjekorranumber vertikaalselt laiali määritud on, seda rohkem muudab täpne metoodika selle kooli edetabelikohta.

Edetabeli tipp — nii esimesed 5 kohta — eriti ei varieeru. Sealt edasi läheb asi aga kiiresti palju kirjumaks: enamiku koolide koht varieerub u 20 võrra ja mõnel koguni 100 kohta 120-st! (Väga suur variatsioon tekib, kui koolil on üks eksamitulemus erakordselt hea või erakordselt halb võrreldes sama kooli ülejäänud kahe tulemusega.)

Ma ei ütle, et kui eesmärk on koole järjestada, siis see metoodika on täiesti mõttetu. Pigem tahaksin, et selliste pingeridade juures antaks ligikaudne usaldusvahemik, mis küll tihti näeks välja umbes “kool X asub vahemikus 30-80”, aga see annakski õige ettekujutuse edetabeli usaldusväärsusest.

Magistritöö post mortem

Mu magistriõpe ETH Zürichis kulmineerus magistritööga, mis omakorda lõppes töö kaitsmisega veidi enam kui kaks nädalat tagasi. Juhendan sel õppeaastal ise kaht lõputööd, mis annab mulle pildi vorstitegemisest teiselt poolt liini, seega jagan enne unustamist lühidalt, mida ma kogu protsessi käigus õppisin, ja loodan, et sellest on kasu tulevastele baka- ja magistritöötajatele.

Continue reading

Kas skandaal mõjutas Taavi Rõivase häälesaaki valimistel?

Tänane postitus on külalispostitus: autoriteks on Kadri Pungas ja Taavi Pungas.

Eelmisel nädalal sattusid huvitava ajastusega järjestikku mõned sündmused:

  • KOV valimiste eelhääletamine, sh e-hääletamine – kestis kolmapäeval kuni 18:00-ni.
  • Pommuudis meedias Taavi Rõivase nn Malaisia skandaali kohta – avaldati neljapäeva varahommikul, diskussioon jätkus elavalt veel mitmeid päevi.
  • KOV valimiste valimispäev – pühapäev.

Inimeste valimisotsuseid potentsiaalselt oluliselt mõjutav skandaal ilmus meedias pärast e-hääletamise lõppu, aga enne paberhääletamist valimispäeval. Teisisõnu ei saanud skandaal e-hääli mitte kuidagi mõjutada, samas kui Taavi Rõivasele antud paberhäältest peaks skandaali põhjustatud mainekahju juba välja paistma.1 Tänu Vabariigi Valimiskomisjoni lahkusele andmete avaldamisel on e-hääletamise tulemus paberhäältest eristatav, seega on võimalik kontrollida, kui palju hääli sai “skandaalne Taavi Rõivas” mainekahju tõttu vähem kui “tavaline Taavi Rõivas”.

Continue reading

Uus podcast: 20midagi

Inimesed, kes on oma ala tipus, on tavaliselt vanuses 40-60, mõnikord harva ka kolmekümnendates. Meedia teeb nendega intervjuusid ja katab nende tegemisi, aga jätab tähelepanuta teise põneva grupi inimesi: noored, kes teevad ägedaid asju, aga kes pole veel piisavalt kaua töötanud, et olla tippu jõudnud.

Panin tähele, et mu tuttavate hulgas on palju selliseid kahekümnendates noori ja otsustasin olukorra muutmiseks midagi ette võtta. 20midagi on uus podcast, kus räägin just selliste inimestega: noorte tulevaste maailmamuutjatega. Üritan aru saada nende mõttemallidest, motivatsioonist, edu valemist ja paljust muust. Podcasti veebileht on 20midagi.ee ja sealt leiab lingid iTunesi, YouTube’i ja podcasti sotsiaalmeedia lehtedele. Visuaalselt näeb ta välja selline:

Esimeses saates rääkisin Heiki Riesenkampfiga järgmistest teemadest:

  • Mis on tootejuhtimine, mida teeb tootejuht (product manager) Google’i skaalal ja mis teeb selle töö raskeks?
  • Mida teha, kui tahad teha leivatootmisettevõtet ja oled jõudnud punkti, kus sul on garaažis euroalusetäis leiba?
  • Miks tasub aatomite maailmas tegutsedes uurida välja, kas kellelgi on su toodet vaja?
  • Kuidas ainult ühe teema õppimisele spetsialiseerumine võib kahjulik olla – nii keskkoolis kui ülikoolis?
  • Kuidas välisülikoolis õppimine ja välismaal õppimine annab motivatsiooni suuri asju ellu viia?
  • Miks ei tasu end lasta häirida asjadest, mis on su kontrolli alt väljas?
  • Miks Heiki piirab enda sotsiaalmeedia kasutust?
  • Mida võiks Eestis teistmoodi teha?

Loodan, et peate neid vestlusi sama põnevaks kui mina. Heameelega kuulan, mida episoodidest arvasite — kirjutage!

Sissejuhatus andmeteadusse

Terve suve on minu poolt postituste põud olnud. Ühelt poolt olen keskendunud magistritööle (tähtaeg on septembri lõpus), aga veel suurem põhjus on olnud Data Science Estonia.

Nimelt kirjutasin koos paari teise panustajaga datasci.ee lehele 7-osalise postituste seeria “Sissejuhatus andmeteadusse” — soovitan seda lühidalt vaadata ja kui praegu lugeda ei jõua, siis meilile tellida.

Lisaks sellele olen organiseerinud üritusi seeriast Ülikoolist andmeteadusse, mille eesmärk on tuua erinevate erialade tudengitele rääkima sama taustaga andmeteadlane, kes siis räägiks oma põhjustest ja teekonnast andmeteadusse minekul. Esimene üritus toimus septembri alguses Tartus, teine toimub samas juba sel reedel ja kolmandat plaanime oktoobriks Tallinnasse. Videod, slaidid ja tulevaste ürituste lingid leiad datasci.ee/meetup.

Kolmas põhjus, miks vähem kirjutan, ongi minu jaoks veidi asendus blogimisele. Tulen sellega välja ilmselt oktoobri alguses, aga tehniliselt on ta juba praegu avalikult kättesaadav — pead lihtsalt oskama otsida. Kindlasti annan ka blogis ja meililistis teada, kui projekt avapaugu saab; jää ootama!