Paar aastat tagasi otsustasin, et andmetega tegelemine on pikaajaliselt mõistlik: esiteks tundus see mu olemasolevate kalduvustega sobivat, teiseks tundus masinõppe kontseptsioon mulle äge ja võimas ja kolmandaks tundus, et tegu on tulevikus aina olulisemaks muutuva alaga.
Tagantjärele tundub objektiivselt — töö- ja koostööpakkumiste ja üldise huvi põhjal –, et mu valik oli õige. Arvan, et see on siiani mõistlik suund, kuhu siseneda: soovitan praegu ülikoolis esimestel kursustel õppijatele keskenduda andmetöötlusele. See soovitus kehtib sõltumata erialast ja tegelikult isegi juba ammu ülikooli lõpetanutele: olla “see tüüp, kes andmetega värki teha oskab” oma alal (olgu see sotsiaalteadus ülikoolis või tootearendus firmas) on hea nišš ja hea viis olla kasulik paljudele kolleegidele.
Pealegi on tegu üldistuvate oskustega, mistõttu ei ole keeruline liikuda teise firmasse või teadussuunda ja seal samasugust väärtust pakkuda. Ma tean vähemalt kaht psühholoogia taustaga andmeteadlast, üht keemikut, üht majandusteadlast ja hunnikut arvutiteadlasi/matemaatikuid/statistikuid/füüsikuid. Tugeva matemaatilise taustaga on võimalik päris kiiresti masinõppega järje peale saada ja ülejäänutel on võimalus võtta ette andmeteaduse teine pool: visualiseerimine ja sisuline analüüs — kaks asja, mis on ettevõtetes väga kasulikud.
Ülalkirjutatust on paljud kindlasti aru saanud ja leidnud, et andmetega töötamine on tõepoolest äge, ning võib-olla isegi võtnud paari kursust sel teemal. Selles positsioonis olles on õppimise mõttes väga väärtuslik teha praktilisi projekte, aga kohe kerkivad küsimused: mis küsimusele oleks huvitav vastata? Mis andmeid võiks selleks kasutada (ja mis on üldse kättesaadav)?
Nendele küsimustele vastamiseks lõin datasci.ee alla lehe, kus on praegu 10 projektiideed, igaühe kohta lühike motivatsioon, kirjeldus ja raskusaste. Projekte on nii lihtsaid kui keerulisi ning nad eeldavad eri taustaga inimesi, seega loodan, et sealt on igaühel midagi põnevat leida.
PS: Lehele saab uusi projektiideid Githubi kaudu lisada igaüks, seega ära jäta oma ideed sahtlisse vedelema!