Machine Learning – analytiikan historiaa.

Machine Learning (ML) ja Artificial Intelligence (AI)
tunkevat tajuntaan joka suunnasta.
Kohta varmaan taksikuskin kanssa joutuu näistä juttelemaan.
On siis vanhan tilastotieteilijän syytä selvittää, mistä on kyse.

 

Jotta tietää minne on menossa, on tiedettävä, mistä on tulossa.

Valmistuin maisteriksi Jyväskylän yliopistosta vuonna 1994. Pääaineeni oli tilastotiede. Mummolle kerroin, että ”tilastotiede on ilmiöiden kuvaamista numeerisin menetelmin. Maalari maalaavat, kirjailijat kirjoittavat ja tilastotieteilijät tekevät käppyröitä”. Hän oli tähän tyytyväinen ja menimme kahvipöytään.

Tilastotiede on ilmiöiden kuvaamista numeerisin menetelmin.
Maalari maalaavat, kirjailijat kirjoittavat ja tilastotieteilijät tekevät käppyröitä.

…”kuvattava ilmiö” voi olla prosessin tehokkuus tai vaikkapa asiakaskannan arvo.

Opintojen jälkeen päädyin ”junantuomana” Helsinkiin ja vuosituhannen vaihteessa olikin konsulttina ollut rakentamassa useiden merkittävien organisaatioiden johdon raportoinnin työvälineitä. Databusineksessa ”Data Warehousing”, ”OLAP-/kuutioraportointi” ja ”Balaced ScoreCard” olivat aikansa hypetermejä.

Kehitys kehittyy ja ja uuden tekemisen myötä tulevat termit peittävät “vanhat”.

Samaan aikaan tuli internet, kännykät, DataMining ja analytiikkaan perustuvat palvelukokonaisuudet (”Solutions”) kuten Marketing Automation tai Risk Management. Huomasinkin juputtavani “neuroverkko-hypetyksestä”, joka sekoitti hyvin kehittyvää analytiikkabusinesta. Tämän jälkeen uusia ”sekoittavia juttuja” on tullut säännöllisin välein: automatiikka, BigData, OpenSource, DataScience … ja nyt AI ja ML.

Kehitys kehittyy ja uuden tekemisen myötä tulevat termit peittävät “vanhat”. Sanonta kuuluukin, että “kehitys ei koskaan tule olemaan niin hidasta kuin nyt”. Se kuitenkin on huonoa, että “uusi juttu” helposti huuhtoo edelliset jutut juuri kun niitä tukeva teknologia ja yleinen osaaminen olisi ollut kypsymässä käytännön toteutuksia tukevalle tasolle. Näin kehitys ottaa ehkä kaksi askelta (tekno) eteen, mutta joskus ainakin yhden (kommunikaatio) taaksepäin.

Asiantuntijoiden ja asiantuntijaorganisaatioiden tuleekin käyttää energiaa siihen, että ymmärretään uuden ja vanhan suhde edes yleisellä tasolla: “mitä ML on, ja mitä sen ei kannata yrittää olla”.

En tässä poraudu Machine Learning määritelmään, katso toinen kirjoitus teemalla: ”mitä ML on – suhteessa perinteiseen tilastotieteeseen?

Organisational Learning oli 1990-luvun hype.
2000-luvun alussa tuli automatisaatio ja sitten BigData.

Asiaa pohtiessani huomasin miettiväni, että jos ML tarkoittaa sitä, että data-analytiikka opettaa koneita älykkäämmiksi, niin tarkottaisiko OL (”Organisational Learning”) sitä, että data jalostetaan organisaation älykkyyden kasvattamiseksi? Tätähän se ”uusi juttu” taisi olla 1990-luvulla. Muistankin tuolloin ihmetelleeni yliopiston heikkoa valmistamista tälle uralle – en tuolloin tajunnut olevani uuden äärellä.

Toivottavasti koulutusjärjestelmä on kehittänyt ketteryyttään, jotta “uusien juttujen” perässä pysytään.

 

Kuinka sitten yleisesti varautua tulevaan –  digitalisaation tuomaan datatsunamiin?


Itse – stick to your guns and keep mind & eyes open.
Tunnustaudun aikakauteni tuotokseksi ja ”datasta lisäarvoa organisaation ihmisille” (OL) on aina ollut selkeästi minun juttu – myös ihan koodaamisen tasolla. Jatkossakin keskityn datastrategian ja -arkkitehtuurin määrittämiseen sekä konkreettisessa datatyössä strukturoidun massadatan analyyttiseen hallintaan ja jalostamiseen.
Strukturoimattoman OnLine-datan reaaliaikainen analytiikka olkoon uuden sukupolven tilastotieteilijöiden hommia 😉

Yhteiskunta – koulutus. Data-analytiikan sovellusalueiden kirjo tuskin pienenee jatkossa, joten toivottavasti koulutusjärjestelmä pystyy tarjoamaan korkealaatuista koulutusta data-analytiikan eri suuntautumisalueille. Yhteistyötä kaupallisten toimijoiden kanssa tulee tiivistää ja haluaisin nähdä oppilaitoksilta vahvempaa edustusta alan seminaareissa. Ehkä myös tässä OL/ML–jaottelussa olisi oppilaitoksilla jopa erikoistumisen mahdollisuutta?

Organisaatiot – datastrategia. Digitalisaatio tuo organisaatioille jatkuvasti uutta ja monipuolisempaa dataa, joka on jalostettavissa liiketoiminnan tehostamiseksi. Siksi strategiasalkkuun on syytä lisätä erillinen osio datastrategialle. Datan kerääminen, hallinta, jalostaminen ja hyödyntäminen on suunniteltava omaehtoisesti, tavoitteellisesti ja systemaattisesti.  Hyvä peruskysymys on esimerkiksi OL-/ML-jaottelu: kuinka asia ymmärretään omassa organisaatiossa ja kuinka data sekä resurssit tukevat strategisia valintoja? Datastrategia tulee linkittää tiiviisti ainakin tietosuojatyöhön (kts. ”tietotilinpäätös”), liiketoimintastrategiaan ja HR-strategiaan.

 

Katso Arvotiedon malli datastrategian laatimiseksi.

Kirjoituksen toinen osio otsikolla: Mitä ML on – suhteessa perinteiseen tilastotieteeseen?

Uusin (10/2018) päivitys teemaan kirjasuosituksen kautta.

 

pps. Muutama hyvä artikkeli data-analytiikan kehityksestä:
http://dataconomy.com/2016/03/beginners-guide-history-data-science/
https://hbr.org/2017/06/how-analytics-has-changed-in-the-last-10-years-and-how-its-stayed-the-same

 

 

Top