Dataleikki kiehtoo tietojohtajaa

Minä uskon, että tietoaltailla (datalake) on lähiaikoina tärkeä merkitys tietojohtamisen kehityksessä, enkä nyt tarkoita vain tiedolla johtamista vaan nimenomaan tietojohtamista. Minulle tiedolla johtaminen on kapeampi päätöksentekoon kytkeytyvä tarkastelukulma tietoon. Tietojohtaminen pohtii tietoon liittyviä kysymyksiä laajemmin.

Uskon, että sekä valmiit allasratkaisut että jo teeman parissa tehtävä kehittämistyö synnyttävät uudenlaista dialogia, jonka kautta toiminta kehittyy.

Mistä siis on kyse?

Ensin vähän määrittelyä. Itse pidän tästä selityksestä:

A data lake is a storage repository that holds a vast amount of raw data in its native format and stores it unprocessed until it is needed. A data lake uses a flat architecture to store data so the data is completely unstructured and left in the format in which it was originally ingested, although each data element in the lake is assigned a unique identifier and tagged with a set of extended metadata tags. That way when a query is run, it can be run against a smaller set of data with the specific tags rather than processing all of the data in the lake.”
(https://www.datamation.com/big-data/data-lake-vs-data-warehouse.html)

Tietoallasta verrataan usein tietovarastoon. En nyt lähde tähän keskusteluun sen syvemmin tässä (kts. kuva alla). Totean vain, että tietojohtamisen näkökulmasta tietoallas edustaa mielestäni uudenlaista ajattelutapaa, jossa tietorakenne tai tiedon muoto ei ole ennalta määrätty. Altaaseen voi siis viedä minkä muotoista dataa vaan – samaan altaaseen. Ja tästäkös tietojohtajan pitäisi innostua.

Data Lake vs Data Warehouse

Kuva: https://www.datamation.com/big-data/data-lake-vs-data-warehouse.html

Muutama käytännön esimerkki selventänee asiaa.

Ne, jotka ovat joskus tehneet kyselyitä tai haastatteluja tunnistavat eron suljetun kysymyksen ja avoimen kysymyksen välillä. Kyselyn avoin kenttä tai teemahaastattelu mahdollistavat huomattavasti rikkaamman datan kuin suljetut vastinparinsa. Suljettu kysymys määrittää vastausavaruuden.

Toinen esimerkki liittyy mittaamiseen. Organisaation avainmittarit johdetaan tyypillisesti organisaation strategiasta. Näitä kyseistä organisaatiota kiinnostavia mittareita seurataan ja dataa kertyy. Toki organisaatio kerää paljon muutakin dataa, mutta lähtökohtaisesti tämä kaikki ei ole raportointipurkissa jatkuvasti käytettävissä. Johdon työpöydältä tai Excel-välilehdeltä löytyy tasan juuri ja vain se data, jota sille on päätetty kerätä.

Erityisen haasteelliseksi asetelma muuttuu, kun siirrytään usean toimijan yhteistyössä tapahtuvaan toimintaan (esim. hybridihallinnan tapauksessa). Kullakin toimijalla kun on omat tärkeät asiansa ja datansa. Lisäksi järjestelmät, tietorakenteet tai tiedon muodot vaihtelevat ja rajapinnat puuttuvat.

Tähän haasteeseen tuo tietoallas ratkaisun. Ainakin teoriassa.

Tietoaltaaseen voidaan tuoda erimuotoista dataa ja tietorakenne luodaan vasta kun dataa haetaan tai luetaan. Altaassa olevalta datalta voi kysyä huomattavasti laajempia ja moniulotteisimpia kysymyksiä kuin tietovarastolta, jossa on vain sitä dataa ja siinä muodossa kuin sinne kantamäärittelyä luotaessa älyttiin tuoda.

Altaaseen voisi esimerkiksi sujahtaa sulassa sovussa talous, henkilöstö, asiakas ja prosessidata. Tämän jälkeen, oli allasta sitten louhimassa tekoäly tai näppärä datatieteilijä, vastausavaruus olisi huomattavasti laajempi kuin suljetussa mallissa.

Keskeiseksi kysymykseksi tämän jälkeen nousee se, mitä uskallamme ja osaamme kysyä. Kenellä on käyttöoikeudet ja valta?

Tietoaltaista on tällä hetkellä paljon puhetta. Tekojakin löytyy. Tietoaltaiden suunnittelu ja toteuttaminen on hyvässä vauhdissa niin kansallisella, alueellisella kuin paikallisellakin tasolla. Yrityskentässäkään allaspuheet eivät ole vieraita. Ja kaikkeahan tutkija ei edes pääse kuulemaan.

Tietojohtamisen tutkijayhteisölle heitän seuraavan kysymyksen: Miten uudet teknologiat ja niiden mahdollistamat toimintamallit haastavat tietojohtamisen ajattelun, mallit ja ”teoriat”?

Vai onko niin, että vasta nyt teknologia on tietoaltaiden kautta mahdollistamassa kaiken sen, mistä tietojohtamisessa on ollut koko ajan kyse?

Leave a comment