Prioriteedid, Starship ja esinemine tehisintellekti tuleviku teemal

Lisaks informaatikutele peetud ettekandele rääkisin hiljuti sarnasel teemal TTÜs, seekord majandusteaduskonna tudengite kutsel. Karin võttis selle ka linti; rääkisin peamiselt tehisintellekti oodatavast mõjust ühiskonnale ja majandusele.

(video YouTube’is)

Jagan viimasel ajal ettekannete videoid, et natukenegi oma tegemistest ja mõtetest teistega jagada. Blogimine on praegu üsna madala prioriteediga: esikohal on töö Starshipis. Oma elu tagasisaamiseks tegelen praegu intensiivselt outsource’imisega: üritan oma elust eemaldada tegevusi, mida saab veidi raha rakendades kellegi teise kätte anda. Aeg ei ole limiteeriv tegur — paar tundi nädalas leiaksin ikkagi — probleem on pigem tähelepanu, kuna enne magamajäämist/trennis/trollis/jalutades (ehk diffuse režiimis) peas käivaid teemasid ei saa olla eriti palju ning just nendes kohtades tekivad kõige paremad mõtted.

Starship on kõige põnevam pikaajaline projekt, mida ma kunagi teinud olen. Esiteks on robotite ehitamine lahe, teiseks on töö sisuliselt raske ja läheb hästi kokku mu taustaga ja kolmandaks on kõik ümbritsevad inimesed väga heal tasemel. See viimane on natuke stressirohke (ma kirjeldan seda tavaliselt nii, et “kõik mu ümber on oma töös paremad kui mina oma töös, ja 50% neist on minu töös paremad kui mina”), aga samal ajal ka motiveeriv, seega areng on kiire.

Paradoksaalselt: mida rohkem ja põnevamaid ideid mul on, seda vähem on aega neid jagada. Loodan sellegipoolest paari kuu pärast jälle rohkem avaldama hakata — ilmselt peamiselt podcaste, aga ideaalis ka läbimõeldud postitusi.

Ettekanne: andmeteadusest ja masinõppest TÜ informaatikutele

Eelmisel nädalal rääkisin Tartu ülikooli informaatika esmakursuslastele andmeteaduse ja masinõppe põnevusest ja olulisusest. Slaidid leiad siit ja video siit.

Ettekanne tuli üsna hästi välja hoolimata sellest, et peaaegu ainuke teema mu peas viimase kahe kuu jooksul on olnud robotite ehitamine, ja tudengite tagasiside oli päris hea: 154 tudengi tagasiside keskmine hinne oli viiepalliskaalal 4.55.

Minu jaoks põnevaim üksik slaid oli andmeteaduse rollist suures pildis: see peaks aitama jõuda arusaamatust ja mürasest andmekogust selgete ja praktiliste otsusteni.

Magistritöö post mortem

Mu magistriõpe ETH Zürichis kulmineerus magistritööga, mis omakorda lõppes töö kaitsmisega veidi enam kui kaks nädalat tagasi. Juhendan sel õppeaastal ise kaht lõputööd, mis annab mulle pildi vorstitegemisest teiselt poolt liini, seega jagan enne unustamist lühidalt, mida ma kogu protsessi käigus õppisin, ja loodan, et sellest on kasu tulevastele baka- ja magistritöötajatele.

Continue reading

Sissejuhatus andmeteadusse

Terve suve on minu poolt postituste põud olnud. Ühelt poolt olen keskendunud magistritööle (tähtaeg on septembri lõpus), aga veel suurem põhjus on olnud Data Science Estonia.

Nimelt kirjutasin koos paari teise panustajaga datasci.ee lehele 7-osalise postituste seeria “Sissejuhatus andmeteadusse” — soovitan seda lühidalt vaadata ja kui praegu lugeda ei jõua, siis meilile tellida.

Lisaks sellele olen organiseerinud üritusi seeriast Ülikoolist andmeteadusse, mille eesmärk on tuua erinevate erialade tudengitele rääkima sama taustaga andmeteadlane, kes siis räägiks oma põhjustest ja teekonnast andmeteadusse minekul. Esimene üritus toimus septembri alguses Tartus, teine toimub samas juba sel reedel ja kolmandat plaanime oktoobriks Tallinnasse. Videod, slaidid ja tulevaste ürituste lingid leiad datasci.ee/meetup.

Kolmas põhjus, miks vähem kirjutan, ongi minu jaoks veidi asendus blogimisele. Tulen sellega välja ilmselt oktoobri alguses, aga tehniliselt on ta juba praegu avalikult kättesaadav — pead lihtsalt oskama otsida. Kindlasti annan ka blogis ja meililistis teada, kui projekt avapaugu saab; jää ootama!

Head ja halvad mudelid

Kalev teavitas hiljuti avalikkust, et mingi muudatuse tõttu tootmisliinides võivad teatud tooted hakata sisaldama maapähklite jääke. Firma pani teavituse üles ka oma Facebooki lehele, mille all siis mõned pettunud inimesed kommenteerisid stiilis “Kalev kaotab nüüd palju kliente” ja “miks kõik asjad peavad olema ära rikutud”.

USA-s on pähklitele allergilised 0.6% inimestest; eeldatavasti Eestis umbes samapalju. Oletame, et 2017. aastal on Kalevil kaks varianti: a) teha kõik tooted pähklijääkidevabaks ja sihtida 100% turust või b) kasutada samu liine pähkliga ja pähklita maiuste tootmiseks ning sihtida 99.4% turust.

Kui eeldada, et Kalev on nagu vastutustundlik ja hooliv vanem, kes tahab kogu riigile head, valib ta ilmselgelt variandi a. Me ei tohiks ju jätta kõrvale inimesi lihtsalt sellepärast, et neil on (tahtlikule kontrollile allumatu) allergia?

Continue reading

Neli sõnakõlksu: masinõpe, tehisintellekt, suurandmed, andmeteadus

Jagan nelja enda definitsiooni mõistetest, mida kasutatakse palju, aga mille jaoks üldlevinud definitsioone kokku lepitud pole.

Masinõpe [machine learning]: hulk meetodeid, mis võimaldavad arvutil õppida kogemuste põhjal keerulisi ülesandeid lahendama.

Masinõppe kohta kirjutasin paar kuud tagasi ka põhjaliku postituse.

Tehisintellekt [artificial intelligence]:

1) inimese poolt loodud agent, mis on intelligentne, kus “intelligentne” tähendab ligikaudu “inimtasemel”. Mõnikord mõeldakse ka tehisintellekti all üldist intellekti, mis tähendab, et agent on võimeline õppima erinevaid ülesandeid lahendama ja teadmisi ühest ülesandest teise üle kandma.

2) uurimissuund, mille eesmärk on arendada ülalmainitud agente.Tehisintellekt kasutab palju masinõppe meetodeid, aga ka klassikalisemaid arvutiteaduse algoritme (nt otsingupuid).

Suurandmed [big data]: andmestikud, mis ei mahu ühe arvuti mällu (RAMi).

Suurima mäluga Amazoni virtuaalmasinal on praegu mälu 2 TB (2000 GB). Mõnikord mahuvad andmed küll ära, aga nende töötlemine võib nõuda kordades rohkem mälu.

Andmeteadus [data science]: ükskõik milline tegevus, mis aitab andmete põhjal kasulikke otsuseid teha.

See võib tähendada väga mittetehnilisi asju nagu kirjalikke analüüse või lihtsat kirjeldavat statistikat, veidi tehnilisemat tööd nagu andmete ettevalmistamist või visualiseerimist, või matemaatiliselt keerulisemaid asju nagu ennustamist (masinõppe meetodeid kasutades).