Avoindata esimerkki 5. Datajournalismikone (Case Oulu ja kuntavaalit 2012).

Datajournalismi on median harvoja kasvualueita, jolle avoimet datat tarjoavat ehtymättömän lähteen ammennettavaksi.

Arvotieto on kasannut datakokonaisuuden, joka helpottaa mielenkiintoisen datatarinoinnin tekemistä.

 

Datajournalismi ei koskaan ole tekninen suoritus.
Hyvän lopputuloksen tekemisessä tarvitaan interaktiota
sopivan kysymyksenasettelun ja alueen tuntijan kanssa.

 

Tässä esimerkissä esitellään pientä maistiaista erityyppisten datojen yhdistämisen ja analytiikan mahdollisuuksista.

Perusdatat: Tilastokeskuksen Paavo -data, osoitedata ja kunnallisvaalit 2012 tulosdata.

Perustyö:

  1. Postinumeroalueiden data-analytiikka ja aluetyypitys. Paavo-datan perusteella Arvotieto on tehnyt kullekin Suomen postinumeroalueelle luokituksen, joka karrikoidusti kuvaa aluetta: Kuntakeskus, OKT-alue, Kerrostaloalue, Lapsiperhealue, Työttömyys, Mökkialue ja Muut alueet. Lisäksi useita muita dataparamtereja, jotka kuvaavat postinumeroalueen sosioekonomista rakennetta.
  2. Rakennemuutosanalyysi. Paavodataa on vuosilta 2015, 2016 ja 2017. Tämä mahdollistaa muutoksen tarkastelun eli ns. “rakennemuutoksen” kuvaamisen. Todettakoon, että työttömien määrän kasvaminen on merkittävin rakennemuutosparametri yllättävän monella alueella(?!).
  3. Kuntavaalien 2012 tulosdatan organisointi siten, että syntyy “yksi rivi per vaalialue” ja informaatio kertoo vaalialueen tulostarinan: äänestysprosentti, äänet, jakauma puolueittain, voittajapuolue, ääniharava ja kunkin puolueen sijoitus.
  4. Vaalitulosdatan yhdistäminen postinumeroalueeseen ja sitten vaalituloksen kertominen postinumeroalueittain.

Näin rakennettu ns. “Datamart”, jonka avulla voi monipuolisesti tarkastella
alueen sosioekonomista rakennetta, sen muutosta sekä yhteyttä
esim. kuntavaalien 2012 tulokseen (tai päinvastoin (syy -seuraus)).

 

Alla neljä esimerkinomaista kuvakaappausta MS Power BI:n käyttöliittymästä, jonka kautta dataa ja informaatiota voi visuaalisesti esittää.

  1. Yleiskuva vaalituloksesta (ja alueen väestöjakaumasta Paavoparametrien perusteella)
  2. Puolueiden kilpailuasetelma suhteessa toisiinsa
  3. Rakennemuutosanalyysin kautta näkymää alueeseen ja äänestyskäyttäytymiseen.
  4. Alueiden mediaanituloissa on eroja … kuinka tämä näkyy äänestyskäyttäytymisessä.

 

_keskustan_voittoalueet
Kuva 1.: Äänijakauma aluetyypeittäin ja voittajapuolueittain. Valittuna alueet, joissa Keskusta voittanut (valinta näkyy tässä hieman huonosti, tehty oikean yläkulman piirakkakuviosta).

_keskusta_sijoilla_3_5
Kuva2: Puolueiden kilpailuasetelma. Tässä valittuna alueet, joissa Keskusta jäänyt sijoille 3-5. Oikeassa yläkulmassa voittaneiden puolueiden saamat äänet ja oikealla alhaalla näiden alueiden (10kpl) ääniharavat. Vasemmalla alhaalla aluetyypit (pääasiassa kerrostaloalueita).

_rakennemuutos_tyottomyysalueet
Kuva 3: Rakennemuutos. Tässä valittuna alueet, joissa työttömyyden kasvu merkittävin rakennemuutostekijä. Tällaisia vaalialueita Oulussa 34 kpl. Oikeassa yläkulmassa alueiden voittajapuolueet ja jakauma vaalialueen koon mukaan.

_talouksien_mediaanitulot_maalimenestys
Kuva 4: Alueen kotitalouksien mediaanitulot (oikean alakulman graafi). Vaalin tulosjakauma sekä rakennemuutosta kuvaava pylväikkö. Tässä ei ole tehty mitään valintaa, joten näkyy, että Oulun seudulla on 55 vaalialuetta ja 143 000 äänioikeutettua.

 

 

Tämä on siis esimerkki Oulun kunnan seudusta. Datassa on koko Suomi ja alueita voidaan tarkastella eri tasoilla (postinumero – kunta – maakunta). Myös datojen puolesta tämä oli rajallinen esimerkki. Alueellisesti yhdistettäviä avoimia datoja tarjoavat lisäksi Kela, Trafi ja moni muu toimija.


Teknisesti kaikki on mahdollista ja mielikuvitus on siis ainoa rajoite.

Laadukas sisältö datajournalismiin rakennetaan yhdessä kiinnostavan kysymyksenasettelun ja sisältöasiantuntijan kanssa.
Hyvä tekninen alusta ruokkii luovuutta.

Takaisin muihin esimerkkeihin.

Top