Juba klišeeks muutunud ütluse järgi on andmed tänapäeva nafta. See ei tähenda aga ainult andmetes olevat ülisuurt raha, vaid ennekõike arusaama, et nii nagu ilma töötlemata naftaga pole palju peale hakata, ei ole ka andmetest ilma analüüsita eriti kasu.
Nii on suurel osal keskmistest ja suurtest ettevõtetest erinevatesse süsteemidesse või aegunud andmeladusesse kogunenud tohutud andmehulgad.
See on ka loogiline, sest suured andmehulgad käivad äritegemisega kaasas – need tekivad nii kliendisuhtlusest ja turunduskampaaniatest kui ka müüginumbritest, tegevuskulude aruannetest ja paljudest muudest täiesti igapäevastest tegevustest. Lisaks sellele on andmetel komme luua uusi andmeid. Oskuslikul kasutamisel aitavad kõik need andmed tööd optimeerida ja äritulemusi parandada, kuid seda ei tehta, sest jõud ei käi aina lisanduvatest andmetest üle. Kõige sagedasem komistuskivi on andmete killustatus erinevate ladude ja süsteemide vahel ning nende süsteemide jõudlus vajalike andmeid kasulikku formaati teisendada.
Majasisene analüütika ja aruandlus
Kui organisatsioonis tekivad andmed, siis tavaliselt on andmete esimene kasutusjuht sisemine aruandlus, näiteks erinevad ärilised mõõdikud. Selleks tuleb kõigepealt liidestada erinevaid olemasolevaid andmeladusid, andmebaase ja teisi kohti, kuhu juba on andmed salvestatud. Levinuim viis selleks on teenusepakkuja või partneri palkamine, kes aitab teha vähemalt esmase seadistuse ehk ühendada erinevad andmeallikad. Selleks luuakse andmejärv ehk ühtne repositoorium, kuhu agregeeritakse kõikidest erinevatest allikatest andmed, et neid oleks analüüsimisel lihtsam ristkasutada. Põhimõtteliselt piiramatu mahutavusega andmejärved on kuluefektiivsed, väga täpsete turvaprotokollidega (nt saab täpselt limiteerida, milline süsteem mingeid andmeid näeb) ja võimaldavad liidestada mistahes olemasolevaid andmeladusid või teenuseid. Kuigi juba ainuüksi andmejärve loomine on paljude organisatsioonide jaoks suur edasiminek, ei aita see andmeid analüüsida.
Selleks loob andmespetsialist nendesse süsteemidesse erinevaid eelseadistatud aruanded, mida saavad õiged inimesed reaalajas jälgida. Lihtsustatud näide: populaarse e-poe kasutajasõbralikumaks optimeerimine lihtsa Exceli tabeliga või ad-hoc SQL päringutega võib olla paras väljakutse – sinna tuleb andmeid sisestada kindlal kujul, ülevaate saab genereerida ainult tagantjärgi ja kolleegidega peab jagama staatilisi faile. Ühendatud andmeallikad ja eelseadistatud aruanded võimaldavad aga saada reaalajas ülevaate kliendikäitumise muutustest, optimaalselt eraldada ressursse, näha varjatud trende, täiendada laovarusid vastavalt müügile jne.
Andmete baasil võimaliku tuleviku ennustus
Kui esimene samm on astutud, on aeg astuda järgmine ja siduda andmeanalüüsiga tehisintellekt, mis aitab reaalajas avastada anomaaliaid, luua ja analüüsida erinevaid tulevikustsenaariume, ennustada trende ja võluda andmetest välja teadmisi, mis muidu võtaks tunde kui mitte päevi või isegi kuid.
Tehisintellekti kasutamine on tehtud nii lihtsaks, et sellega saab hakkama ka ilma igasuguse erialase ettevalmistuseta inimene. Piisab, kui on olemas teadmine, et mitmetel pilvteenuse pakkujatel on erinevad valmisteenused ehk APId (andmepõhine prognoosimine, mustrite tuvastamine, pildilt ja videost objektide ja nägude tuvastus, häältuvastus tekstiks ja vastupidi, vestluse konteksti jälgimine jne), mis oskavad andmete pealt teha erinevaid järeldusi ja ennustusi. Muidugi on võimalik ka luua täiesti oma AI-teenused või -mudelid, kuid see on tavaliselt keerulisem ja nõuab juba suuremat investeeringut. Küll aga ei tähenda see, et ei saaks erinevaid keerulisemaid AI teenuseid oma äri jaoks kasutada. Suurematel pilvteenusepakkujatel on mitmed erinevad teenused kiirelt AI klastrite käivitamiseks ning sageli ka suur kataloog eeltreenitud mudelitega, mida saab mõningase kohendamisega kasutada.
Täna maadleb enamus Eesti ettevõtteist endiselt veel esimese punki kallal ehk püüab oma andmetest aru saada ning leida viise, kuidas neist ärilist kasu saada. Pahatihti proovitakse seda teha vanade lahendustega (lisades täiendavad andmeladusid ning lokaalseid analüütikarakendusi), kuid praktika on näidanud, et kõik need katsed luhtuvad, sest nii ei ole võimalik saada loodetud tulemusi. Pilveteenused, andmejärved, tehisintellekt ja masinõpe on tegelikult palju kättesaadavamad ja kasulikumad kui arvata võiks.
KLEMENS ARRO
ADM Cloudtech