On raske arendada oma andmetega seotud oskusi, kui ei ole andmeid, mida analüüsida. Eriti keeruline on leida andmeid, mida ei ole igast küljest läbi töödeldud.
Siin lehel on huvitavad andmestikud, mille olen internetist leidnud või ise kokku kraapinud. Kui leian uusi allikaid või avaldan uusi andmestikke, lisan nad siia, seega soovitan aeg-ajalt vaatamas käia.
Minu avaldatud
Siin on andmestikud, mille olen kas ise internetist kraapinud (Facebook ja kv.ee) või olemasolevast andmestikust paremaks muutnud. Minu teada ei ole neid väga palju uuritud — saad olla esimene! Kui avaldad nende põhjal midagi, palun anna mulle märku (näiteks kommentaarides) — tahan teada, kui minust kasu on olnud.
Asendusteenistujate teenistuskohad
Riigiasutuste ja KOVide palgaandmed
Riikliku alkoholiregistri avaandmed
Andmestike kollektsioonid
Keskendun siin Eestiga seonduvatele andmestikele, kuna teisi riike puudutavaid andmestikke on internetis palju (vt nt TÜ matemaatilise statistika instituudi kodulehelt).
Riigi avaandmed
Teoreetiliselt peaks suurem osa Eesti riigiasutuste andmetest avalikult kättesaadav olema; selle jaoks on loodud avaandmete portaal opendata.riik.ee. Praktikas on seal (2015. aasta sügise seisuga) üsna vähe andmeid, aga sealt võib leida päris huvitavaid andmestikke — näiteks riigihangete registri väljavõtte CSV kujul.
Praegu on arenduses (aga juba kättesaadav) opendata.ee R-i teegi (library) arendus. See võimaldab riigi avaldatud avaandmeid (ja tulevikus ka teisi andmeallikaid) mugavalt R-i ühe käsuga laadida.
Datasci.ee kollektsioon
Eesti andmeteaduse lehel on korralik nimekiri Eestiga seotud andmestikest.
Jaga: