Graafikud: Eesti palgajaotus ja palgalõhe

Riigi kodanike palk näitab midagi olulist riigi kohta: näiteks saab iga eestlane võrrelda, kas ta teenib teistest eestlastest rohkem või vähem. Uudistes, raportites ja igasugustes analüüsides räägitakse enamasti keskmisest palgast ja kuigi aritmeetiline keskmine on kõigile selge tõlgendusega arv, ütleb see palgajaotuse kohta väga vähe.1 Paljudes olukordades on keskmise palga vaatamine sama kasutu nagu ütlemine, et keskmisel inimesel on pool peenist ja üks rind.

Milline on siis Eesti palgajaotus? Guugeldades “eesti palgajaotus” on esimene tulemus palgajaotustest, mida tegin Bondora avalikke andmeid analüüsides. Delfi Ärileht on küll natuke kirjutanud keskmise ja mediaani erinevusest, aga täielikku jaotust ei suuda ma internetist leida. Sellepärast teen täna väga lühikese postituse Eesti palgajaotusega, et see oleks kuskil internetis olemas, ja jätan interpreteerimise mõneks teiseks korraks.

Siin ta on (2014. aasta andmetel):

Continue reading

Lase (andmetel) oma meelt muuta

Mulle meeldib andmetega töötamise juures protsessi mitmekülgsus: see hõlmab muuhulgas koodikirjutamist, disaini, inimestega suhtlemist ja mõtlemist probleemi sisu üle. Nii paljude eri asjadega tegelemine võib killustada, aga õnneks seob kõike seda kokku mõtteviis, millega ükskõik millisele küsimusele või probleemile läheneda: teadlase mõtteviis.

Continue reading

Kuidas täpsemaid otsuseid teha: tõenäosustes mõtlemine

Viimasel ajal olen pidanud oma Facebooki uudisvoogu sirvides mitu korda grimasse tegema: kõigepealt MMSi saaga peale, kus inimesed kasutasid enda ja oma laste ravimiseks mürgist ainet, ja täna ema peale, kes keeldus andmast keemiaravi oma ajukasvajaga tütrele ning “otsustas hakata tütart ravima end teenäitaja-terapeudiks kutsuva mehe näpunäidetel” (ma ei süüdista siin muidugi ainult ema — “teenäitaja-terapeut” kannab vähemalt sama palju süüd).

Aga kas tegu on ikka lollusega? On ju piisavalt näiteid sellest, kuidas inimkond on midagi arvanud ja siis paar hullu on näidanud, et see on vale (kusjuures need hullud on seejuures tugevalt hukka mõistetud): näiteks arstid hakkasid käsi desinfitseerima alles 19. sajandi lõpus. Kuidas peaksime tegema otsuseid olukorras, kus kõik ei ole mustvalge?

Continue reading

Põhinipid selgete graafikute tegemiseks

Ma pööran palju tähelepanu andmete visuaalsele esitusele. Korralikult visualiseeritud andmete põhjal saab teha kasulikke otsuseid või muuta oma meelt mõne olulise probleemi osas; halvast visualiseeringust ei ole heal juhul kellelegi kasu ja halval juhul eksitab see inimesi olulistes küsimustes. Toon siin postituses välja paar elementaarset nippi, mis aitavad minul teha graafikuid, mis a) näevad head välja ja b) annavad info kiiresti ja efektiivselt edasi.

Continue reading

Külalispostitus: Tallinna Vee erakordsed päevad börsil

Käesolev postitus on siin blogis esmakordne: see on külalispostitus Mihkel Kreelt — füüsikadoktorandilt, kelle igapäevatöös on tähtsal kohal eksperimentaalsete mõõtmisandmete statistiline töötlemine ja analüüsimine. Mihkel reageeris operatiivselt Tallinna börsil sel nädalal toimunule ja kirjutas juhtunust põneva analüüsi. Pikema jututa annan nüüd sõna talle.

Continue reading

Andmeteadus: vajalikud oskused ja kuidas alustada

Andmeteadust kirjeldatakse viimasel ajal tihti kui 21. sajandi seksikaimat ametit. Üks töökaaslane mainis mulle hiljuti, et Eestis lihtsalt ei ole piisavalt tarkvarainsenere, kes oleksid ka andmetega tugevad. Ennustatakse, et järgmise paari aasta jooksul jääb maailmas täitmata sadu tuhandeid andmeteadlase kohti. Igatpidi on selge, et on hea aeg andmeteadusega tegelema hakata, aga kuidas?

Continue reading

Eesti andmeteadus: blogid, õppematerjalid ja ettevõtted

NB: siin lehel olev info on vananenud. Kõige uuema info leiad lehelt datasci.ee.

Viimase paari kuu jooksul olen kokku sattunud hulga inimestega, kes nimetavad ennast andmeteadlaseks (või võiksid seda teha). Nendega arutades ja ise uurides olen saanud mingi pildi, mis praegu Eestis andmeteaduse vallas toimub, ja jagan seda avalikult, kuna tundub, et praegu ei ole keskset kohta, kust selline ülevaade saada. Ma ei järginud mingit definitsiooni, mis täpselt on andmeteadus ja mis mitte – sama asja võivad kirjeldada ka näiteks sõnad ‘analüüs’ ja ‘modelleerimine’.

Continue reading