Modernin analytiikan toimintamalli mahdollistaa datan alkuperän tutkimisen

data analytiikka
JUUSO VILJANEN
24.01.2022

Liiketoiminnassa käytettävän analytiikan tavoitteena on tuoda päätösten perusteeksi dataa subjektiivisten näkemysten sijaan. Monissa yrityksissä on jo jollain tapaa valjastettu data liiketoiminnan palvelukseen, eikä päätöksiä perusteta silkkaan arvailuun. Usein analyysit ovat kuitenkin riippuvaisia tulkinnan tekijöistä ja analytiikkaa tehdään jokseenkin puolivillaisesti.

Tässä blogissa käsittelemme modernin analytiikan toimintamallia, joka mahdollistaa luotettavan, standardisoidun liiketoimintatiedon.

Ei raporttitehdasta muttei myöskään omatoimisuuden utopiaa

Analytiikan alkuaikoina tehtiin hyvin keskusjohtoista vakioraportointia. Tällainen raporttitehtaaksikin haukuttu malli on yhä käytössä monin paikoin, ja vaikka raporttien toimitusajat saattavat tehtaassa olla tuskastuttavan pitkiä, hyvänä puolena prosessihallittu raportointi on selkeää ja yhtenäistä.

Raporttitehtaista on monin paikoin siirrytty itsepalveluanalytiikkaan, jonka avulla käytännössä jokainen voi olla analyytikko. Hyvänä puolena on kaivattu ketteryys, mutta huonona puolena mittareiden määrittelystä ei välttämättä ole konsensusta, ja analysointitavatkin saattavat poiketa toisistaan niin, että analyysi on kovastikin tekijänsä näköinen. Ei ole ollenkaan itsestään selvää, että organisaatiossa kaikki ovat samaa mieltä siitä, mitä tunnusluvuilla tarkoitetaan ja miten ne kuuluu laskea.

Analytiikan kanssa mentiin siis tavallaan ojasta allikkoon: ensin kukaan ei saanut osallistua analysointiin, seuraavaksi datan käsittelykykyä odotettiin kaikilta. Itsepalvelun lopputuloksena saadaan usein yhtä monta analyysiä kuin on tekijöitäkin. Jotta analytiikka olisi aidosti relevanttia ja hyödyllistä, pitäisi ottaa pieni askel taaksepäin, mutta erittäin suunnitellusti. Voidaan puhua modernin analytiikan toimintamallista.

Mallia ohjelmistokehityksen puolelta

Ohjelmistokehitystä on jo pitkään tehty järjestäytyneesti ja selkeillä pelisäännöillä. On selkeää, kuka työstää mitäkin osaa esimerkiksi applikaatiosta, ja kuka tahansa koodia vähänkin ymmärtävä voi tutkia sitä toisen jättämien kommenttien perusteella. Vastaava systemaattisuus on nyt tekemässä tuloaan datan käsittelyn puolelle. Tavoitteena on tehdä datan käsittelystä systemaattista ja hallittua tekemättä siitä liian raskasta.

Ohjelmistokehityksestä tutut viitekehykset eivät välttämättä sellaisenaan sovi datan ja analytiikan kehittämiseen. Alalle onkin muodostumassa omia, vielä vakiintumattomia toimintamalleja, jotka nojaavat vahvasti ohjelmistokehityksen malleihin. Joitain fundamentteja on jo syntynyt, mutta vielä ei olla ihan samalla tasolla ohjelmistokehityksen kanssa. Suunta on kuitenkin oikea.

Analytiikan metriikkakerros systematisoi datan mittareita

Analytiikka on hieman samanlaisessa tilanteessa kuin mittayksiköiden kanssa oltiin ennen Ranskan vallankumousta. Kun dataa voi analysoida käytännössä kuka vain, emme aina tiedä, miten mittarit vertautuvat toisiinsa. Tulosten stardardoimiseksi on välttämätöntä systematisoida tekemistä.

Kukaan ei halua palata raporttitehtaiden aikaan, mutta tiettyjen asioiden laskeminen valmiiksi keskusjohdon toimesta on järkevää. Kaikkia ääripisteitä ei kuitenkaan ole tarpeen lukita eikä kaikkia kombinaatioita tarvitse miettiä valmiiksi. Ennen kaikkea tarvitaan jäsentyneempää datan kehittämistä. Analytiikkaan täytyy tuoda metriikkakerros, joka systematisoi mittareita.

Perinteisesti on ajateltu, että itsepalveluanalytiikka ratkaisee useat keskusjohtoisen raportoinnin muodostamat ongelmat ja näin on toki suurelta osin käynytkin. Itsepalveluanalytiikka tuo mukanaan kuitenkin omanlaisensa haasteet mittareiden tulkintojen ja niiden monimuotoisuuden kautta. BI-työkalut eivät pysty yksinään tätä ongelmaa ratkaisemaan, koska mittarit luodaan ja monistetaan yhä uudelleen ja uudelleen työkalujen sisällä. Syntyy nopeasti rikkinäinen puhelin. Metriikoiden yhdenmukaistaminen omaan kerrokseensa tuo tarvittavaa systemaattisuutta myös itsepalveluanalytiikan hyödyntämiseen. Itsepalveluanalytiikan ongelma on usein, että loogisia määrityksiä asioille tehdään useissa kerroksissa. Eri kerroksissa tehtyjen määrityksien yhdeksi suureksi ongelmaksi muodostuu, ettei kokonaisuudessa pystytä kovinkaan helposti palaamaan takaisin datan alkulähteille. On työlästä ellei mahdotonta selvittää, kuka minkäkin muutoksen on tehnyt ja missä vaiheessa. Datan alkuperän selvittämistä hankaloittaa sen kulku monen järjestelmän kautta, jotka usein puhuvat eri kehityskieliä

Huolehdi kaikki datan käsittelyn vaiheet kuntoon

Jotta kerätty data olisi paremmin loppukäyttäjien saavutettavissa ja vastaisi paremmin nopeasti kasvaviin tietotarpeisiin, täytyy kaikkien datan käsittelyn vaiheiden ja niihin tarvittavien työkalujen olla kunnossa. Niitä ovat datan kulkujärjestyksessä:

  • Täysin hallittu data pipeline eli dataputki. Ideaalisti dataputki toimii järjestyksessä Extract - Load - Transform (ELT). Data tallennetaan nopeasti ja tehokkaasti raakamuodossaan, koska nykyisillä ratkaisuilla tallentaminen on halpaa ja helppoa, eikä tässä vaiheessa välttämättä tarvitse ottaa kantaa datan muotoon.
  • Datan integraatiopalvelu, esim. Fivetran
  • Datan määränpäänä pilvipohjainen tietovarasto tai data lake, esim. Snowflake tai Amazon S3
  • Tietojen muuntamistyökalu, esim. dbt
  • Työkalu, jolla hallita datan viemistä takaisin operatiivisiin järjestelmiin, kuten Salesforceen (Reverse ETL, Census, Hightouch)
  • Business Intelligence eli BI-kerros, käytännössä tietojen visualisoinnin ja jakelun alusta, esim. Tableau tai Power BI

Nämä työkalut sisältävää teknologiakokonaisuutta kutsutaan nimellä Modern Data Stack. Tavoitteena on tietoa integroimalla analysoida yrityksesi dataa ennakoivasti uusien mahdollisuuksien löytämiseksi ja tehokkuuden parantamiseksi. Tärkeimpänä erona vanhoihin teknologioihin on se, että Modern Data Stack on isännöity pilvessä ja vaatii hyödyntäjiltään erilaisia teknisiä taitoja: komentorivit ovat vaihtuneet käyttöliittymiin sekä SQL-pohjaisiin työkaluihin.

Modern Data Stack on siis teknologiakokonaisuus, joka on modernin analytiikan toimintamallin keskiössä. Modern Data Stack ei siis välttämättä ota kantaa siihen miten asioita olisi hyvä tehdä, vaan enemmänkin siihen, millä teknologioilla niitä tehdään – Joskin teknologiavalinnat aina myös ohjaavat tekemistä. Modernin analytiikan toimintamalli voi hyvinkin tulevaisuudessa olla teoreettinen viitekehys analytiikan tekemiseen.

Tavoitteena luotettava itsepalveluanalytiikka

Tässä teknologiakokonaisuudessa ei sinänsä ole mitään uutta tai ihmeellistä. Muutos on siinä, että työkalut integroituvat keskenään yhä paremmin ja rajat ovat hieman selkeämpiä kuin aikaisemmin, vaikka toki päällekkäisyyksiä on vieläkin. Pahimmillaan jokaista työkalua on ollut työstämässä oma porukkansa, joka on toiminut omien käytäntöjensä mukaan, jopa omalla ohjelmistokielellä, omanlaistaan raportointia tehden.

Ongelmat eivät aina välttämättä ratkea hankkimalla kaikki datan käsittelyyn tarvittavat järjestelmät yhdeltä toimijalta. Modernin analytiikan toimintamalli on ennemminkin askel poispäin tällaisesta platform-ajattelusta, jossa kaikki palvelut ostetaan yhdeltä pilvitarjoajalta. Yhdysvaltojen startup-maailmasta lähtöisin oleva malli kirittää platform-toimijoita parantamaan omaa tuotekehitystään.

Standardisointi mahdollistaa yhteistyön ja verkostoitumisen. Modernin analytiikan toimintamallin ydinajatuksena on varmistaa, että data ja siitä tehty analyysi on oikeellista, ei tekijänsä näköinen tulkinta todellisuudesta. Tavoitteena on, että jatkossa organisaation mittarit on standardoitu yhdenmukaisesti kaikissa sovelluksissa. Silloin liiketoimintatietoa voidaan jatkossakin hyödyntää itsepalveluna, mutta luottavaisin mielin.

Kiinnostuitko aiheesta? Lataa Matkaopas kohti modernimpaa analytiikkaa

Arrow-short-Digital-lollipopOpas on sinua varten, jos ymmärrät datan hyödyt, mutta analytiikka ei vielä palvele liiketoimintasi tarpeita. Loikka modernimpaan vaatii tahtoa datan hyödyntämiseen!

Solutions

Lue lisää