Neli sõnakõlksu: masinõpe, tehisintellekt, suurandmed, andmeteadus

Jagan nelja enda definitsiooni mõistetest, mida kasutatakse palju, aga mille jaoks üldlevinud definitsioone kokku lepitud pole.

Masinõpe [machine learning]: hulk meetodeid, mis võimaldavad arvutil õppida kogemuste põhjal keerulisi ülesandeid lahendama.

Masinõppe kohta kirjutasin paar kuud tagasi ka põhjaliku postituse.

Tehisintellekt [artificial intelligence]:

1) inimese poolt loodud agent, mis on intelligentne, kus “intelligentne” tähendab ligikaudu “inimtasemel”. Mõnikord mõeldakse ka tehisintellekti all üldist intellekti, mis tähendab, et agent on võimeline õppima erinevaid ülesandeid lahendama ja teadmisi ühest ülesandest teise üle kandma.

2) uurimissuund, mille eesmärk on arendada ülalmainitud agente.Tehisintellekt kasutab palju masinõppe meetodeid, aga ka klassikalisemaid arvutiteaduse algoritme (nt otsingupuid).

Suurandmed [big data]: andmestikud, mis ei mahu ühe arvuti mällu (RAMi).

Suurima mäluga Amazoni virtuaalmasinal on praegu mälu 2 TB (2000 GB). Mõnikord mahuvad andmed küll ära, aga nende töötlemine võib nõuda kordades rohkem mälu.

Andmeteadus [data science]: ükskõik milline tegevus, mis aitab andmete põhjal kasulikke otsuseid teha.

See võib tähendada väga mittetehnilisi asju nagu kirjalikke analüüse või lihtsat kirjeldavat statistikat, veidi tehnilisemat tööd nagu andmete ettevalmistamist või visualiseerimist, või matemaatiliselt keerulisemaid asju nagu ennustamist (masinõppe meetodeid kasutades).