NB: siin lehel olev info on vananenud. Kõige uuema info leiad lehelt datasci.ee.
Viimase paari kuu jooksul olen kokku sattunud hulga inimestega, kes nimetavad ennast andmeteadlaseks (või võiksid seda teha). Nendega arutades ja ise uurides olen saanud mingi pildi, mis praegu Eestis andmeteaduse vallas toimub, ja jagan seda avalikult, kuna tundub, et praegu ei ole keskset kohta, kust selline ülevaade saada. Ma ei järginud mingit definitsiooni, mis täpselt on andmeteadus ja mis mitte – sama asja võivad kirjeldada ka näiteks sõnad ‘analüüs’ ja ‘modelleerimine’.
Päris kindlasti on siit välja jäänud infot, milleni mina ei ole jõudnud. Kui oskad midagi lisada, siis kommenteeri siia alla ja uuendan postitust!
Blogid
28.04.2015: lisasin blogi Welcome to data science.
17.05.2015: lisasin blogi Analüüsiait.
- pungas.ee – minu blogi kohta saab lugeda siit. Seni olen postitanud umbes kord kuus.
- stat24.ee – põnevad autori enda läbiviidud andmeanalüüsid koos ilusate visualiseeringutega. Teemad on enamasti Eestiga seotud ja ulatuvad päevakajalistest (valimised, Veerpalu doping) üldisteni (netikommentaarid, postiindeksid, karjäärivalikud). Kirjutab Tanel Pärnamaa kord paari kuu tagant.
- andmeteadus.ee blogi – siit leiab üldiseid andmeteaduse teemalisi postitusi, näidisanalüüse tõlgendustega, kommentaare teiste projektide kohta ja muudki. Lugejalt suurt tehnilist taiplikkust ei eelda ja on kirjutatud üsna hästi arusaadavalt tavainimesele. Kirjutab Kristjan Eljand keskmiselt kord kuus (üsna ebaregulaarse graafikuga).
- Statistikablogi – siin kirjutab Statistikaamet erinevatest Eesti rahvastikku, majandust jpt aspekte puudutavatest andmetest. Tegu on natuke klassikalisema kirjeldava statistikaga, aga kommentaarid ja analüüs on asjalikud.
- Welcome to data science – tegu on küll inglisekeelse blogiga, aga autorid (Lauri Koobas ja Valdar Tammik) on eestlased. Teemad osalt tehnilised (andmeanalüüs R-is), aga ka kommentaarid veebikursuste, huvitavete artiklite/videote, tööpakkumiste jm kohta. 2015. aastal on seni ilmunud 4 postitust.
- Analüüsiait – TÜ majandusteaduskonna lõpetanud modelleerijate algatatud blogi, et majandusanalüüse ja nendega seonduvat avaldada. Küllaltki kvantitatiivne; postitatakse üsna ebaregulaarselt, paar korda aastas.
Eestikeelsed kursused ja materjalid
01.03.2016: uuendasin kursuse linki.
Praegu eesti keeles eriti materjale ei ole. Ainuke, millega kursis olen, on kursus Statistiline andmeteadus ja visualiseerimine, mille korraldamisega alustasid Tartu Ülikoolis Kaspar Märtens ja Tanel Pärnamaa. Kõik õppematerjalid (v.a. mõned konfidentsiaalsed andmehulgad) on avalikud ja kursus on põnev selle poolest, et aines toimuvadki ainult praktikumid (mille täpsed juhised on aine kodulehel kättesaadavad!) ja loengute asemel on viited erinevatele huvitavatele videotele ja artiklitele. Käsitletakse andmete kraapimist, puhastamist, analüüsi, visualiseerimist jm. Peamised märksõnad: R, knitr, dplyr, ggplot2, shiny, rvest.
Tahtmise korral leiab palju andmeteaduse-teemalisi ja seotud inglisekeelseid kursuseid erinevatest MOOC-ide keskkondadest (Coursera, edX, Udacity jt) ja ülikoolide endi kodulehtedelt.
Eestis tegutsevad ettevõtted
18.04.2015: uuendasin Teleporti infot.
28.04.2015: lisasin Lauri kommentaari põhjal infot.
06.07.2015: lisasin Bondora.
- Skype‘s tehakse andmeteadust erinevates tiimides – näiteks kõne kvaliteedi parandamiseks, aga ka maksete ja pettuse vältimise osas.
- Transferwise‘s otsitakse andmeteadlase profiilile vastavaid inimesi Growth Analysti nime all kliendibaasi analüüsima ja kasvatama.
- Eesti Energia Energiamüügi alaüksuses analüüsitakse “klientide liikumist, klientide profiilide segmenteerimist ja tulevikutehingute hinnastamist” (allikas: praktikapakkumine tudengitele).
- Teleport.org kasutab maakera erinevaid andmekihte, et aidata inimestel optimeerida oma elukohta. Suur osa töötajatest on Eesti või eesti taustaga digitaalsed nomaadid.
- Xpressomics ja Quretec teevad rohkem teadusega (bioinformaatika ja terviseandmed) seotud andmekaevet.
- andmeteadus.ee on (vist Eesti esimene ja siiani ainuke) puhtalt andmeteaduse konsultatsioonile suunatud ettevõte.
- Adcash – olen kuulnud, et seal analüüsitakse reklaamiandmeid, aga ei oska öelda, kas info tõele vastab.
- Funderbeam analüüsib idufirmasid ja Lauri andmetel tegeleb samuti andmeteadusega.
- Nortal otsib andmeteadlast oma Omaani kontorisse.
- Bondora otsib inimesi oma laienevasse andmeteaduse tiimi.
Tõenäoliselt tehakse suurel skaalal andmeanalüüsi ka mujal, näiteks pankades, (väike)laenuandjate juures ja muudes finantsettevõtetes, telekommunikatsiooniga tegelevates ettevõtetes, kindlustusfirmades jne, aga ma ei ole seni kohanud inimesi ega töökuulutusi, mis seda kinnitaks.
Jaga:
Teleporti võid täiesti julgelt nimetada samavõrra Eesti (või #estonianmafia) firmaks kui Skype või Transferwise. 🙂
Lisaks füüsiliselt Eestis olevale kontorile on meie data science / machine learning teemade vedajate Ardo ja Silveri taskus Eesti passid ka siis kui nad parajasti Shveitsis või Columbias elavad.
Aitäh! Ma ei suutnud (väga lühikese) otsinguga aru saada, kui tugev seos Teleportil Eestiga on. 🙂
Hea töö! Lisaks võiks tuua, et Funderbeam peaks andmeteadusega tegelema. Teise lisandusena on kindlasti ka hulk laenuettevõtteid – olen üle aasta selle valdkonna tööpakkumisi jälginud ja andmeteaduse kuulutusi on olnud nii kohalikel väikelaenajatel kui ka näiteks MyJar / TrustBuddy ja muud taolist. Ehk siis finantssektoris on vähemalt huvi selles suunas. Kolmandaks on veel üks blogi: welcome-to-data-science.blogspot.com
Aitäh! Lisasin info postitusse 🙂