Suomessa luottamus julkisen sektorin tuottamaan tiedon laatuun on korkea. Tämä näkyy myös luottamuksena yhteiskuntaan. Miten voimme varmistaa tiedon laadun jatkossakin tai miten sitä voidaan kehittää edelleen? Miten tiedon laatua voi arvioida? Yhtenä välineenä julkishallinnon tiedon laadun arviointiin on kehitetty tiedon laatukriteereitä, jotka antavat meille yhteisen kielen ja kehikon puhua niinkin moniulotteisesta asiasta kuin tiedon laatu. Millaisia toiveita tutkijoilla ja muilla tiedon käyttäjillä on julkisen sektorin tiedon laadulle? Miten tiedon laadun arviointi saadaan osaksi arkea ja missä ollaan viiden vuoden kuluttua? Tässä jaksossa näistä teemoista ovat keskustelemassa pääjohtaja Markus Sovala Tilastokeskuksesta ja johtaja Mika Maliranta Työn ja talouden tutkimus LABOREsta. Keskustelua johdattelee viestintäjohtaja Hanna Ikäheimo Tilastokeskuksesta.
[äänite alkaa]
Haastattelija 1 [00:00:00]: Tiedon määrä kasvaa yhteiskunnassa räjähdysmäisesti, kun kaikenlainen toiminta heijastuu digitaaliseen maailmaan. Samalla ovat kasvaneet tarpeet tiedon käytölle ja tiedon arvo syntyy, kun tietoa käytetään. Ja tietoa taas hyödynnetään, kun se on riittävän laadukasta. Suomessa luottamus julkisen sektorin tuottaman tiedon laatuun on korkea ja tämä näkyy myös luottamuksena yhteiskuntaan. Miten voimme varmistaa tiedon laadun tai miten sitä voidaan kehittää edelleen, ja miten ylipäänsä tiedon laatua voidaan arvioida? Yhtenä välineenä julkishallinnon tiedon laadun arviointiin on ajateltu yhteisiä tiedon laatukriteereitä, jotka antavat meille yhteisen kielen ja kehikon, jonka avulla puhua aiheesta. Mutta mitä hyötyä tästä kaikesta on, ja mitä ovat tiedon laatukriteerit ja miten niitä käytetään? Näihin kysymyksiin meidän on tarkoitus keskittyä tänään tässä podcastissa. Tämä on Tiedon äärellä, tietopolitiikasta tekoihin podcast, jossa pureudumme tietopolitiikan toimenpiteisiin ja kysymyksiin. Podcastissa pohdimme muun muassa sitä, mitä tietopolitiikka oikein on ja miksi julkisen tiedon avoimuus, laatu ja yhteentoimivuus on tärkeää. Pohdimme näitä aiheita eri näkökulmista yhdessä mielenkiintoisten ja vaikuttavien vieraiden kanssa.
Haastattelija 1 [00:01:22]: Minä olen Hanna Ikäheimo, Tilastokeskuksen viestintäjohtaja. Tänään tässä podcastissa kanssani tiedon laadusta ja sen arvioimista keskustelevat johtaja Mika Maliranta, Työn ja talouden tutkimuslaitos Laboresta ja Tilastokeskuksen pääjohtaja Markus Sovala. Valtiovarainministeriö johtaa parhaillaan tiedon avaamisen ja hyödyntämisen hanketta, eli lempinimeltään TiHa-hanketta. Sen alaisuudessa on taas toiminut Tilastokeskuksen vetämä Tiedon laatukehikko -osahanke, jossa on kehitetty tietoaineistojen laatukriteereitä ja -mittareita. Tänään keskitymme keskustelemaan erityisesti tiedon laadusta. Lähdetään liikkeelle ihan perusteista ja siitä, mitä itse asiassa on tieto. Haluatko ottaa Markus tähän kiinni, mitä sinun mielestä tieto oikeastaan on?
Puhuja 1 [00:02:09]: Jaa-a, jopas on perustavaa laatua oleva kysymys. Samalla tavalla kuin olemme kaikki vähän vanhemmat ihmiset eläneet valtaosan elämästämme melkein täydellisesti materiaalisen maailman ympärillä ja olemme lapsesta saakka tottuneet, että materiasta puhutaan. Se puhuu härjistä joka härjillä ajaa. Ja mitä enemmän yhteiskunta alkaa olla sitä, että se oikea taloudellinen toiminta on sitä tiedon muokkaamista, niin sitä enemmän meidän täytyy opetella puhumaan siitä tiedosta niin kuin ennen puhuttiin materiasta. Ja jotta eri ihmiset ymmärtäisivät toisiaan, niin tarvitaan kieli, millä puhutaan tiedosta.
Haastattelija 1 [00:02:57]: Haluatko tarttua tähän kiinni, Mika?
Puhuja 2 [00:02:59]: Joo. Tietysti nämä on tällaisia kiehtovia, filosofisia kysymyksiä. Itselläni opinnoissa on filosofiaa approbaturin verran ja sekin oli käytännöllistä se filosofia, mitä minä opiskelin. Siinä mielessä minä ehkä suhtaudun äärimmäisen tärkeä, kiehtova teema, mutta en ehkä osaa sitä määritellä. Mutta laajemmin ne asiayhteydet, mitkä tulee mieleen, on se, että kun me halutaan ymmärtää asioiden välisiä yhteyksiä siinä toiveessa, että me voidaan tehdä, vaikuttaa, muuttaa tai parantaa maailmaa, niin siihen ymmärrykseen me tarvitaan tietoa asioiden välisistä suhteista. Siinä mielessä ollaan tietysti aivan olennaisten kysymysten äärellä, että se raaka-aine tämän ymmärryksen rakentamisessa on kai sitä tietoa. Niin sen laatu on aivan olennainen asia ja vielä vastaan siitä kulmasta, kun itselläni on ollut ikään kuin tämä painopiste koko ajan siellä tutkimuksen puolella, niin ehkä jos minä pikkuisen motkotan ennen kaikkea aikaisempaa taloustieteellistä tutkimusta ja varmaan tämä koskee muitakin tutkimuksia. Ehkä akateemisessa tutkimuksessa välillä on sellainen helmasynti, että ollaan kiinnostuneita enemmän niistä välineistä ja siitä estimaateista kuin siitä raaka aineesta, mitä niissä empiirisissä tutkimuksissa käytetään, koska se tiedon laatu ei ole niin seksikäs asia. Mutta jos mietitään aidosti ymmärrystä, niin se tiedon laatu, usein erittäin kriittinen kysymys sen kanssa, että kuinka luotettavaa ymmärrystä se tutkimus tuottaa.
Haastattelija 1 [00:04:39]: Siihen ei varmaankaan riitä ihan näin yksiselitteinen vastaus, että tieto on joko laadukasta tai ei laadukasta.
Puhuja 2 [00:04:46]: Se on just näin. Toinen vaikea kysymys. Tieto on vaikea määritellä, niin laatu kuuluu juuri siihen samaan kategoriaan. Laatua mitataan muun muassa hintaindeksissä, niin sehän on monidimensioinen asia. Aika kriittinen kysymys on, että kun dimensioita on monia, niin miten niitä eri dimensioita painotetaan. Se vaihtelee hurjasti käyttäjäryhmittäin, että mitkä laatuseikat tai näkökohdat ovat erityisen painottuneita. Itse kun olen tutkija, niin olen ajatellut, että tutkijoilla tässä tiedon laadussa korostunee eri asiat kuin sitten saattavat korostua esimerkiksi virastossa virkamiehen tai -naisen työssä tai maallikon käytössä.
Haastattelija 1 [00:05:42]: Tosi hyvin lähdit jo liikkeelle tähän laatukriteerien maailmaan, mutta minun tekee mieli pakittaa hiukan vielä teidän nykyisiin tehtäviin ja sitä kautta esitellä teitä. Eli sinä toimit Mika Maliranta Tutkimuslaitoksessa ja siitä näkökulmasta käytät aineistona myös sitä tietoa, jota julkishallinnon rekistereihin tulee. Miten arvioisit sitä, että missä kunnossa tämä julkisen hallinnon tieto itse asiassa on, sieltä Tutkimuslaitoksen ja tutkijoiden näkökulmasta?
Puhuja 2 [00:06:10]: Labore on tutkimuslaitos, joka tekee soveltavaa tutkimusta, joka tarkoittaa käytännössä empiiristä tutkimusta, eli käytetään tilastotietoja ja erilaisia tietoaineistoja välineenä. Kun tehdään akateemista tutkimusta, niin voi suoraan sanoa, että ne rekisteriaineistot, mitä Suomessa tämän tyyppistä tutkimusta tekevällä tutkijalla on, ovat ehdottomasti maailman parhaita. Tämä ei ole tilattu mainospuhe, tämä on vain fakta. Pohjoismaat ylipäätänsä ovat aivan ainutlaatuisessa asemassa juuri sen takia, että meillä on tämmöinen rekisteriaineistopohja, joka toimii sellaisena runkona, ja sitten on tällaisia kyselyaineistoja, jotka kaikki kytkeytyy siihen. Se on valtava voima, mikä näihin aineistoihin ja tietoihin tulee siitä, että niitä on keskenään yhdistettävissä.
Puhuja 1 [00:06:57]: Mutta se tosiseikka, että Suomessa akateeminen tutkimusyhteiskuntatieteessä ja taloustieteessä paljon käyttää nimenomaan näitä, mitä sanotaan rekisteriaineistoiksi. Jolla tarkoitetaan sitä kaikkea tietoa, mitä viranomaiset keräävät itse asiassa ihan muihin tarkoituksiin. Se on yksi selitys sille, että miksi meillä täytyy olla kieli, millä me puhumme siitä tiedosta, koska sillä tiedolla on monta käyttäjää. Jos me toimisimme niin kuin enemmistössä maailman maissa, missä tilastokeskukset haastattelevat ihmisiä ja tekevät niistä tilastot ja se on sitten siinä, niin mitäs niistä tiedoista, silloin sitä täytyisi toisten käyttäjien kanssa yhteensovittaa, että mitä niillä tarkoitetaan. Tässä tilastotoiminnassa minun mielestä yksi todella hyvä käsite on se, että puhutaan tiedon arvoketjusta, jolla tarkoitetaan sitä, että ensin se tieto kerätään, sitten sitä vähän korjaillaan ja muokataan, ja ennen kaikkea yhdistetään muuhun tietoon. Ja sitten sille tulee uusia käyttäjiä tämän ketjun loppuvaiheessa. Eli se sama tiedonmurunen kierrätetään tässä kiertotalouden periaatteella moneen kertaan. Eikös sillä, kun menette viemään niitä roskianne kierrätysastiaan, niin kyllähän siellä katsotaan tarkasti, että tähän laatikkoon laitetaan alumiinit ja lasit tänne. Samasta tässäkin on kysymys. Tietoa ei voitaisi käyttää useaan kertaan, jollei siinä samalla kulkisi tieto siitä, että mistä se tieto on tullut, mitä sille on tehty ja miten se on pakattu.
Haastattelija 1 [00:08:32]: Sinä olet toiminut Markus nyt vähän reilun vuoden Tilastokeskuksen pääjohtajana. Tilastokeskuksen kauttahan kulkee hyvin suuri määrä näitä julkishallinnon rekistereissä olevaa tietoa ja myös tutkijat saa tietoa Tilastokeskuksen kautta käyttöönsä. Mikä sinut on yllättänyt työskentelyssä isojen tietovarantojen äärellä?
Puhuja 1 [00:08:51]: Kyllä sitä koko ajan vain hämmentyy, että niistä isoista tietomassoista on yhä vielä käytössä vasta aika pieni osuus. Joskus Mikan kanssa koitettiin arvata, mikä olisi oikea prosenttiluku, mikä siitä tiedosta jollakin tavalla tulee analysoitavaksi, jota tässä Suomessa kertyy. Mitä me heiteltiin, 30 prosenttia, hihaestimaatteja. Mutta valtavasti kertyy tietoa. Mikä on tällaisessa pohjoismaalaisessa asetelmassa kuitenkin todella hienoa, että nämä johonkin muuhun tarkoitukseen. Esimerkiksi sen takia, että autoissa pitäisi olla rekisterikilvet tai verot saadaan maksetuksi, ne näitä varten kerätyt tiedot voidaan käyttää uudestaan toisiin tarkoituksiin. Ja kaikki voidaan tehdä vielä sillä tavalla tietoturvallisesti. Ei sinä yksilön tietoturva ole millään tavalla vaarantuneena. Minusta se on aika hieno tämä pohjoismaalainen kierrätyskuvio.
Puhuja 2 [00:09:52]: Tietohan on tuotteena sellainen omanlaisensa. Usein mietitään näitä tuoteanalogioiden kanssa, että jos vasaraa käyttää, niin mitä kauemmin sitä vasaraa käyttää, niin sen huonommaksi se vasara menee, kun se kuluu käytössä. Ja siinä on vielä se ero, että jos yksi käyttää vasaraa, niin toinen ei voi käyttää sitä. Mutta jos ajatellaan tietoa tuotteena, niin se on näissä molemmissa suhteissa erilainen. Eli se, että minä käytän jotain tietoa, niin se ei millään tavalla poissulje sitä, että samaan aikaan sitä tietoa käyttää joku muukin. Eli se on hyödykkeenä aivan omanlainen. Ja sitten vielä se, että se tieto ei käytössä kulu, vaan se paranee. Se on vähän kuin lihas, että se käytettäessä vahvistuu.
Haastattelija 1 [00:10:39]: Sitten mennään tästä siihen kysymykseen, että tekin viittaatte tässä puheessa jo siihen, että sitä tietoa on ihan valtavasti ja rajattomasti saatavilla eri lähteissä. Ehkä ongelma on löytääkin myös sitä oikeaa tietoa oikeaan tarpeeseen. Voiko nämä laatukriteerit, joita nyt on valmisteltu yhteistyössä toimia myös apuvälineenä tämän informaatiotulvan hallinnassa ja ehkä myös siinä tiedon arvottamisessa juuri sitä käyttötarkoitusta ajatellen?
Puhuja 2 [00:11:08]: Jos minä aloitan käyttäjänäkökulmaa ajatellen, niin mietin sitä, että varmaan monelle käyttäjälle ne tarvitsisi tällaista metatietoa tai kuvausta siitä tiedosta sen takia, että ne on kiinnostuneita jostakin asiasta ja ne haluaisi, että mikä on paras yksittäinen indikaattori kuvaamaan tätä asiaa. Jos siellä on valtava määrä edellisiä tietoja, niin ne haluaisi jonkun katalogin, että antakaa minulle nyt se oikea indikaattori. Ikään kuin vain se yksi. Tutkijoilla asetelma on usein toisenlainen. Ne haluaisi itse asiassa siitä samasta ilmiöstä mahdollisimman monenlaisia muuttujatietoja. Osittain vähän senkin haarukoimiseksi, että tiedetään, kuinka varmalla pohjalla sitten sitten siinä johtopäätöksessä on. Tutkijana olen joskus huomannut, kun tilastoalan ihmisten kanssa asioin, niin ne kyselee, että minkä tiedon minä nyt sitten anna täältä. Tutkijat aika helposti sanoo, että anna kaikki. Tämä on tärkeä asia, kun luetaan niitä laatukriteerejä. Ne ohjaa eri tavalla eri käyttäjäryhmiä.
Puhuja 1 [00:12:19]: Yksi näkökulma tietoon on se, että digitalisaation myötä tiedon muokkaaminen on muuttunut paljon halvemmaksi, mitä se on ennen ollut. Voidaan käsitellä sellaisia tietomassoja, mitä ennen ei olisi vain yksinkertaisesti voitu kerätä eikä käsitellä. Mutta tiedon käsittely on yhä kallista. Ei se vaan muutu ilmaiseksi. Se vaatii paljon käsityötä, se vaatii sen suunnittelua, että mitä sille tiedolle tehdään. Se vaatii sen tiedon muokkaamista. Kyllä näissä asioissa sellainen täydellinen keinoäly ja automaatio on vielä tosi kaukana.
Haastattelija 1 [00:13:00]: Miten sitten jos mennään siihen, kun sitä tietoa on käsitelty ja sitä on paljon, niin kuin nostitte tässä jo esiin. Onko se kuitenkin siiloissa vai löytääkö se käyttäjänsä? Onko niin, että nämä laatukriteerit voi auttaa meitä siinä tiedon hyödyntämisessä ja yhteiskäyttöisyydessä? Mitä te olette siitä mieltä?
Puhuja 1 [00:13:20]: Luulen, että yksi hyvä tapa ymmärtää, että mitä ylipäänsä Tilastokeskus tekee, niin me yhdistetään eri siiloista tulevaa tietoa. Mutta kyllä ne meidän lopputuotteista sitten joku voi sanoa, että vähän siilojahan ne yksittäiset tilastot on. Mutta samanaikaisesti me ollaan menossa kohti sellaista tilannetta, missä näiden meidän tekemien tilastojen lisäksi alkaa syntyä tee se itse-tilastoja. Voi olla, että ihan tavallinen kansalainen ei niitä pysty tekemään, mutta yhä suurempi joukko tutkijoista tosiasiallisesti tekee itse omia tilastojansa. Jos tilastolla tarkoitetaan sellaista, taloustieteilijät ja tilastotieteilijät puhuvat aggregoitua tietoa. Eli missä yksilön tietoja ei ole havaittavissa, vaan tiedot ovat yhdistettyinä.
Puhuja 2 [00:14:12]: Se on se osa Tilastokeskuksen toiminnasta, jonka nyt tunnen jonkin verran hyvin, kun olen ollut aikanaan sitä vähän rakentamassakin. Eli tämä tutkijapalvelut, jossa ideana on ollut se, että ne raaka-aineet annetaan tutkijoiden käyttöön. Siellä ei sitä siiloa huomaa, koska ne on viety ikään kuin samaan saaviin. Pitäähän asioita luokitella ja joutuuhan siinä vähän selvittelemään asioita, mutta minulle tämä siiloutuminen ei ole tuttu ongelma. Mutta kuten Markus sanoi, siihen tämä on mennyt, kuten vähän viittasinkin, että tutkijapalveluiden ansiosta tutkijoilla on pääsy niihin raaka-aineisiin. Ne tekee näitä omia tilastoja. Esimerkiksi meillä minä olen tehnyt ja tutkijoiden kanssa ihan vuosikausia tällaista työpaikka-työntekijävirtatilastoa. Sitä voisi kai kutsua näin. Se on itse asiassa oma tekemä ja sitä on nyt toistakymmentä vuotta päivitetty. Saman tyyppisiä aineistoja Yhdysvaltain tilastovirasto tekee itse. Esimerkiksi Suomessa tutkijat tekee jotain sellaisia tilastoja, mitä jossain toisessa maassa tekee tilastovirastot.
Haastattelija 1 [00:15:26]: Haasta vähän kuitenkin. Sinä kehuit jo tuossa kovasti sitä, että meillä on tosi hyvät rekisterit ja tietoaineistot, jonka pohjaan tutkimusta voidaan tehdä. Mitä toiveita tutkimuslaitos voisi esittää julkisen sektorin tiedon laadulle ja sen kehittämiselle?
Puhuja 2 [00:15:43]: Laatu ajatellaan nyt niiden ominaisuuksien kannalta. Mutta jos ajatellaan vähän laajemmin tämmöisenä laatuun myöskin hinnoittelu, niin tutkimuslaitoksilla on nyt fundamentaali ongelma näiden aineistojen hyödyntämisessä sen takia, että nämä alkaa olla niin kalliita, että on vaikea saada rahoitusta. Eli se laatuongelma alkaa olla ongelma. Meidän täytyy ruveta miettimään, että miten me näitä meidän projekteja järjestetään, että samalla voidaan taloudellisesti hoitaa se. Koska sekä projektien pituus että leveys vaikuttaa siihen hintaan, vaikka ne ei oikeasti vaikuta niihin kustannuksiin.
Puhuja 1 [00:16:20]: Samalla tavalla kun tässä tavaran maailmassa olemme tottuneet puhumaan tuotantokustannuksista ja asioiden hinnoista, niin kyllä me tiedonkin ympärillä joudutaan koko ajan puhumaan myöskin rahasta. Vaikka kuinka tämä suomalainen tapa tehdä tietoa on yksi maailman tehokkaimmista ja halvimmista, niin ei se nyt ilmaista voi olla. Minä luulen, että me alamme tulla sellaiseen tilanteeseen, missä täytyy pystyä ratkaisemaan tutkimuksenkin osalta, miten se tiedontuotanto lopullisesti oikeastaan tulisi rahoittaa. Nythän tavallaan ajatellaan, että tutkimusrahoituksen Suomen akatemian ja kaikkien muiden yksityisten rahoittajien rahoittamissa tutkimusprojekteissa se tiedontuotannon hinta on siellä mukana. Mutta luulen, että se ei ole tehokas tapa järjestää se. Luulen, että aletaan mennä sellaista hetkeä kohden, milloin joudutaan tutkimusrahoituksessa ottamaan yleisemminkin kantaa siihen, että pitäisikö olla joku valtakunnallinen tiedontuotannon rahoitus olemassa.
Haastattelija 1 [00:17:30]: Laatukriteereistä haluaisin kysyä sellaista, että puhuttiin jo tuossa alkuun, että ne on eri käyttäjille erilaisia ne asiat, mitä laadussa arvottaa. Ja laatukriteereissähän on nostettu esiin erilaisia näkökulmia arvottaa sitä tietoa. Nyt jos mietitte henkilökohtaisesti ja oman organisaationne tasolta sitä asiaa, niin nouseeko niistä kriteeristöistä joku sellainen laadun näkökulma esiin, jota arvotatte tällä hetkellä muita korkeammalle?
Puhuja 1 [00:18:00]: Kyllä minä sanoisin, että kaikista ratkaisevinta olisi se, että se tieto voitaisiin siellä alkupäässä kerätä mahdollisimman samarakenteisesti. Eli kaikki se, missä se tiedonkeruu tapahtuu niin se kerättäisiin samalla tavalla. Jos saan ottaa esimerkin tästä sote-tiedosta, joka on tietenkin iso yhteiskunnallinen kysymys, koska sosiaali- ja terveyspalvelut, iso osa julkisen sektorin kustannuksia tulee sieltä. Ainakin minulle yksi motiivi siinä, että ensi vuoden alusta siirrytään isompiin tuotantoalueisiin, niin yksi motiivi sille on se, että sitä tiedon tuotantoa voidaan edes asteittain yhtenäistää. Nythän tällä hetkellä se, miten kussakin kunnassa kirjataan näiden palveluiden kustannukset, se on viime kädessä kunkin kunnan oma ratkaisu. Siksi se syntyvä tieto on epäyhtenäistä ja viittasin siihen, että ei se tiedon muokkaaminen vielä ilmaiseksi ole muuttunut. Ei siinä mikään keinoälykään auta, jos ne perus tietojen rekisteröinti on tehty eri tavalla.
Puhuja 2 [00:19:14]: Minä taas korostaisin sellaista näkökohtaa tässä, ihan toinen näkökohta minkä Markus toi esiin, on se, että tieto ja tilastotiedot on ennen kaikkea vertaamista johonkin. Sen kuvaaminen, että milloin mikäkin on minkäkin kanssa vertailukelpoista. Otan nyt hyvän konkreettisen esimerkin, mikä minulle kertoo, mikä on laadukasta tiedosta kertomista. Meidän talouden tärkein tunnusluku bruttokansantuote, joka on kansantalouden tilinpidon keskeinen suure ja siihen on olemassa hienot tavat, miten se lasketaan. Vuoteen 2001 saakka sitä laskettiin tietyllä tavalla. Sitten tehtiin aivan järkevä uudistus Eurostatin johdosta. Muutettiin tiettyjen sektorien tuotannon volyymien mittaustapaa tavalla, joka vaikutti siihen BKT:n volyymimuutokseen 0,3 - 0,4 prosenttiyksikköä joka vuosi siitä eteenpäin. Tämä aiheutti sen, mitä englantilaiset sanoisi "major", eli vakavan vertailuongelman ennen vuotta 2001 olevien BKT-lukujen ja sen jälkeisten lukujen välille. Minusta hyvä tilastotoime on se, että tästä kerrottaisiin ja kuvattaisiin se niin hyvin, että taloustieteen tutkijat ottavat käyttöön. Olen nähnyt pähkähullujakin tuottavuusanalyysejä. Tässä nyt motkotan myös niille tutkijoille, jotka eivät ole välissä kysyneet, mutta ne eivät olleet ottaneet huomioon tällaista muutosta, joka aiheuttaa valtavat 0,3 prosenttiyksikköä joka ainutta vuotta kohden tästä eteenpäin. Se vaikuttaa todella paljon erilaisiin arvioihin.
Haastattelija 1 [00:21:06]: Suomen virallisilla tilastoillahan on laatuleima. Tästä laatuleimastahan on tässäkin podcast-rajassa keskusteltu jo aikaisemmin. On puhuttu, että voisiko laadukkaille tietoaineistolle antaa jonkinlaisen laatuleiman. Vastuullisella journalismillahan on tämän tyyppinen laatuleima olemassa myös. Mitä te ajattelette tästä? Aloita sinä vaikka Markus.
Puhuja 1 [00:21:30]: Jää vähän auki se, että jos ei lopulta uskota siihen laatuleimaan, niin riittääkö se sellaiselle salaliittoihin uskovalle tai jotenkin kovasti kriittiselle kansalaiselle sitten kuitenkaan, että siinä on tämä leima päällä.
Puhuja 2 [00:21:47]: Olin Tilastokeskuksessa töissä 90-luvun puolivälissä ja silloin oli joku laatutyöprojekti käynnissä siinä yksikössä, missä toimin. Seurasin sitä ja silloin jo jaettiin tilastovirastoille tämmöisiä sertifikaatteja ja rankattiin tilastovirastoja. Silloin Ruotsin tilastovirasto taisi olla ykkönen, jos muistan oikein. Suomi oli kyllä silloinkin lähellä, taisi olla kaikki Kalmarin unionin jälkeläismaat aika lähellä. Meillä on hyvät ja vahvat rekisteripohjat ja vahvat perinteet hyvän tilastotuotannon tekemisessä ja sertifikaatit on tullut ihan ansiosta.
Puhuja 1 [00:22:32]: Tilastotuotantoon viittasin siihen, että tämä vakiomuotoinen tilastotoiminta on kansainvälisesti vakioitua ja sitä tarkasti seurataan. Esimerkiksi Eurostat, joka on Euroopan alueen yhteinen tilastoviranomainen, säännöllisesti tarkastaa kunkin maan tilastotoimia ja Suomen raportti taisi tulla vuoden vaihteessa julki. Saatiin puhtaat paperit. Suomen tilastotuotannolle ei vertaisarvioinnissa löytynyt mitään huomautettavaa. Kehittämistä toki, mutta ei ilmeisiä virheitä.
Puhuja 2 [00:23:17]: Markus toi tärkeän asian esiin, että myös Eurostat ja OECD ansaitsee kiitosta. Näiden mittausten harmonisointi on sillä tavalla arvokasta asiaa, että se Suomen BKT-luku tulee entistä arvokkaammaksi mitä vertailukelpoisemmalla tavalla se on muuallakin mitattu. Me hyödytään Suomessa siitä meidän BKT-luvusta enemmän, kun me tiedetään, että se on myös Italiassa, Saksassa ja muissa maissa mitattu oikein tai ainakin vertailukelpoisella tavalla.
Puhuja 1 [00:23:53]: Itse ajattelen, että hyvä tiedon kombinaatio syntyy siitä, että käytetään samaan aikaan näitä kansainvälisesti vertailukelpoisia tietoja ja sitten niiden rinnalla tehdään ihan räätälöityä juuri sillä hetkellä mielessä olevan ongelman ympärillä olevaa tietoa. Kun nykyään on myös mahdollisuus tuottaa melkein päiväkohtaista informaatiota. Ainakin viikkokohtaista tietoa. Ollaan jo sellaisessa tilanteessa, missä se sinun alkuperäinen toiveesi, että samasta asiasta on monta erilaista lukua, se alkaa olla todellisuutta.
Puhuja 2 [00:24:37]: Nimenomaan. Tarvitaan iso määrä indikaattoreita. Mehän käytiin aikanaan kiistaa, mikä on oikea työttömyysprosenttiluku. Luulen, että molemmat tutkijat ovat sitä mieltä, että se on parempi, että meillä on itse asiassa kahdella tavalla laskettua työttömyyttä. Ne omalla tavallaan täydentävät toisiaan. Tämä toistuu monessa muussakin asetelmassa, koska se on aina vertailua. Tämä on se paikka, missä laatukriteerit tulee äärimmäisen tärkeäksi. Tai kuvaukset siitä, että mihin mikäkin parhaiten sopii ja mihin seikkoihin minkäkin indikaattorin mittauksessa on painotettu.
Haastattelija 1 [00:25:11]: Tuleeko mieleen jotain muita konkreettisia esimerkkejä siitä, mitä mahdollisuuksia tämän tiedon laadun standardointiin liittyen voisi nostaa esiin? Tutkimus on ollut tässä hyvin esillä ja ehkä nopea päätöksenteko ylipäänsä, mutta kenties jotain muuta? Sinä olet Markus puhunut esimerkiksi tästä tiedon arvoketjusta, arvon lisäämisestä ja datan kierrättämisestä. Löytyykö tästä jotain konkreettista?
Puhuja 1 [00:25:36]: Yksi ainakin minua kiinnostava näkökulma liittyy tähän päätöksenteon automatisointiin. Ja missä määrin viranomaisten päätöksentekoa voisi tavallaan myöntää sen tosiseikan, että kyllä se tietokone monta kertaa sen päätöksen tosiasiallisesti tekee. Vaikka siinä paperissa löytyy alta jonkun yksittäisen virkamiehen nimi, niin... toki on sellaista päätöksentekoa, missä asioita tutkitaan eri näkökulmista, mutta useat päätöksentekotilanteet on hyvin mekaanisia ja silloin ne kannattaisi mielestäni myös automatisoida. Mutta yksi näkökulma näillä tiedon arvomittareilla on se, että näin on esitetty. Että ennen kuin tällaista automaattista tekoälypohjaista päätöksentekoa saisi tehdä, niin se tiedon laatu pitäisi olla varmistettu, että se on erityisen hyvässä kunnossa. Siinä varmaan ajatuksena, että silloin kun ihmissilmäpari sitä katsoo, niin se huomaa, että niissä tiedoissa on jotain erikoista ja kone ei tämän ajattelun mukaan sitä ymmärtäisi. Käytännössä se on varmaan juuri päinvastoin. Että kone löytää sieltä ne virheet helpommin kuin ihmissilmä. Joka tapauksessa tämä on yksi teema, mistä keskustellaan tällä hetkellä.
Puhuja 2 [00:27:04]: Aika yleinen käsitys on se, että parhaimmillaan ja ihminen on toisiaan täydentäviä. Useissa tilanteissa päästään parhaaseen tulokseen, että kone on tehnyt jotain työtä ja sitten ihminen täydentää. Minulle tuli mieleen, kun olen lainsäädännön arviointineuvostossa ollut muutamia vuosia nyt ja on valtava tarve tehostaa sitä aineistoa, mikä heillä on käytettävissä. Saatavuutta, ajantasaisuutta, kaikkia sellaisia asioita. Se, miten se tehdään, on iso savotta. En tiedä, auttaako se tekoäly kauhean paljon siinä. Siinä tarvitaan myös virkamiesten tilastokoulutusta, tilastomenetelmien hallintaa ja monenlaisia muitakin asioita. Näen, että kyllä tilastovirastollakin siinä oma roolinsa olisi.
Puhuja 1 [00:27:55]: Mika, jos sallit, minä palaan pikkuisen taaksepäin tässä keskustelussa. Aiemmin oli puhetta siitä, että tiedon kerääminen on se tiedon arvoketjun kallis vaihe, mutta kyllä siellä loppupäässäkin niitä kalliita vaiheita on. Nykyään puhutaan paljon data-analyysista. Silloin, kun me opiskeltiin, sitä kutsuttiin tilastotieteeksi. Osittain samasta asiasta kysymys. Kyllä siinäkin paljon käsityötä yhä vielä tarvitaan. Ennen kuin meidän valmiista tilastoista tai meidän tutkimusaineistosta pystyy vetämään johtopäätöksiä, niin meillä pitää yksinkertaisesti olla niitä tutkijoita, joilla on aikaa niitä aineistoja penkoa. Palaan siihen perusväittämään, että vaikka tiedon muokkaaminen ja prosessointi on muuttunut halvaksi, niin ilmaista se ei vieläkään ole. Ei myöskään siellä tiedon arvoketjun loppupäässä.
Puhuja 2 [00:28:55]: Joo, olet ihan oikeassa. Kaikkein kalleimmat päät on siellä alussa ja sitten siellä ihan lopussa. Juuri siellä kohdassa, missä ihmisen suhteellinen etu on voimakas. Se on se kohta ymmärrys. Eli on tehty analyysi ja sitten tehdään tulkinta, että mitä me olemme oppineet näistä havainnoista ja se on se kallis pää. Minä olen neljännesvuosisadan nyt seurannut sitä loppupäätä, niin siellä on tapahtunut ihan viimeisien rivien valtavaa tehostusta. Kaikki tilasto-ohjelmistomenetelmät ovat kehittyneet valtavasti. Aikanaan, kun minä 20 vuotta sitten estimoin teollisuustilastosta jotain juttuja, niin siinä oli kallista vaihetta, ennen kuin minulla oli tietty vaihe. Nykyisillä uusilla ohjelmistoilla ja toimintamalleilla pystyy säästämään useiden viikkojen työ. Mutta edelleen, kuten Markus sanoi, se viimeinen kallis pää on se, kun halutaan ymmärtää, mitä me olemme oppineet kaikesta tästä. [? 00:29:53] on minun mielestä kiteyttänyt sen hyvin, että tietokoneet ovat ihan valtavan hyviä laskemaan vastauksia, mutta ne ei osaa tehdä kysymyksiä. Ihmiset osaavat tehdä kysymyksiä ja se kysymyksien teko on kallista puuhaa, koska siinä tarvitaan tätä kallista ihmistyövoimaa. Sitä ei koneella voi korvata.
Haastattelija 1 [00:30:11]: Laatukriteerityö tai niiden hyödyntäminen liittyy enemmänkin sinne tiedon arvoketjun alkuvaiheisiin. Siihen, että me päästään näistä suosituksista sinne käytäntöön, liittyy varmaan vielä monta askelta. Miten te arvioitte, miten tiedon laadun arviointi saadaan osaksi arkea?
Puhuja 1 [00:30:31]: Keskeinen lähtökohta on se, että ymmärretään, että sillä tiedolla on aina useampi käyttö. Että harvoin mitään tietoa kerätään vain sitä yhtä ainoata tarkoitusta varten. Ja jos jo lähtökohtaisesti ajatellaan, että kun tämä tiedonmurunen nyt tässä kerätään, niin se tullaan käyttämään kymmeniin tai satoihin kertoihin. Luulen, että se avaa silmiä. Silloin sellainen tiedon laadusta huolehtiminen tulee mielekkääksi, jota se ensimmäinen käyttäjä ei välttämättä ehkä tarvitsisikaan.
Puhuja 2 [00:31:06]: Sitten menen sinne loppupäähän kanssa, jossa minulla on enemmän kokemusta. On valtavasti mennyt eteenpäin, kun käyttäjämäärät ovat neljännesvuosisadan aikana minun näköpiirissäni lisääntyneet aivan valtavasti. Me tehdään empiiristä tutkimusta sekä Suomessa että maailmalla valtavasti paljon enemmän kuin tehtiin vielä parikymmentä vuotta sitten. Se tarkoittaa sitä, että tulee jatkuvasti artikkeleita, joissa on käytetty näitä erilaisia aineistoja. Ja syntyy tavallaan vertailua. Käytetään samoja aineistoja, mutta välillä päädytään erilaisiin johtopäätöksiin ja sitten käydään sitä keskustelua, että mistä ne erot johtuu. Tämä on myös se paikka, että tilastovirastolla on nämä koordinaattoritehtävät ja muut työt, jotka ovat hirveän tärkeitä, mutta olisi hirveän arvokasta, että tilastoviranomaiset voisivat osallistua sillä tilasto-osaamisellaan siihen loppupään tuloksiin. Esimerkiksi kertoa, että kun teillä on tuo ominaisuus teidän tuloksissa, niin se voisi ehkä selittyä sellaisella tietoseikalla, jota nämä tutkijat eivät ole osanneet ottaa huomioon. Mutta se taas vaatii sitä, että joidenkin tilastoihmisten täytyy seurata sitä esimerkiksi taloustieteellistä kirjallisuutta ja ehkä vähän itsekin osallistua siihen tutkimukseen, koska se on ainut tapa ymmärtää sitä keskustelua, tehdä vähän itsekin siihen jotain.
Haastattelija 1 [00:32:30]: Missä te ajattelette, että ollaan viiden vuoden kuluttua, kun ajatellaan julkisen sektorin tiedon laatua ja näitä laatukriteerejä? Mihin ollaan menty?
Puhuja 2 [00:32:40]: Saako toiveunia nyt kertoa? Tämä kehityshän on ollut valtavaa viimeisen 10-15 vuoden ajan ainakin tutkijan puolella. Ikään kuin valmisaineistoja, mikroaineistoja on yhä paremmin saatavilla. Minä odotan, että tämä trendi jatkuu. Näitä valmisaineistoja tulee entistä enemmän, entistä käyttäjäystävällisemmin, entistä paremmin dokumentoituna. Ne saadaan entistä tuoreemmin käyttöön ja myös niin, että se hinnoittelu on rakenteeltaan sellaista, joka johtaa johtaa yhteiskunnan tasolla järkevään resurssien käyttöön. Eli että nämä toimijat pystyvät sitten näitä aineistoja käyttämään ja toimia niin, että ne rajakustannukset eivät nouse kohtuuttomiksi.
Puhuja 1 [00:33:32]: Nyt sitten kun tämä yhteiskunnan peruspolttoaine ja moottori ei olekaan enää se höyrykone tai sähkömoottori, vaan enemmän tieto ja sen käsittely, niin siihen nähden minusta on vielä vähän yllättävää, miten lapsen kengissä tietopolitiikka on. Tavallaan tiedosta ei vieläkään ole tullut päämäärätietoisen päätöksenteon kohdetta. Luulen, että yksi sellainen, mikä olisi hyvä lähtökohta ja mihin voi viidessä vuodessa päästä, että meille määriteltäisiin, millaista tietoa oikeastaan pitäisi tehdä ja mihin kohtaan meidän sitä tiedon arvoketjua pitäisi panostaa, mitä tietoja tulisi kerätä ja miten kierrättää niitä tietoja. Tämä on vähän niin kuin aloittamaton keskustelu. Mutta nyt olla aika lähellä. Luulen, että näillä tiedon laatukriteereillä se on yksi askel, millä me päästään kohti sitä tilannetta, päästään oikeasti puhumaan siitä tiedosta.
Haastattelija 1 [00:34:38]: Te olette tässä podcastin aikana pyörittänyt keskustelua sieltä kaikenlaisista filosofisista pohdinnoista ihan siihen konkreettiseen, mitä tiedon laatukriteereillä sitten lopulta voidaan saada aikaiseksi. Tulkitsen niin, että ajattelette yhdessä kuitenkin sillä tavalla, että tiedon laatukriteerit luo yhteisen pohjan meidän ymmärrykselle. Kielen, jonka avulla me voidaan keskustella siitä yhteisestä aiheesta, siitä tiedosta, joka lisääntyy valtavaa vauhtia yhteiskunnassa. Mutta jatkossa me tarvitaan lisää vielä vuoropuhelua eri toimijoiden välillä ja me tarvitaan lisää koordinaatiota ja sitten niitä askelia kohti sinne viiden vuoden unelmaa tai haavetta, jolloin tiedon laatukriteerit on arjessa vielä paremmin mukana. Tähän haluaisin päättää tämän podcast-lähetyksen. Haluan kiittää teitä teidän polveilevasta keskustelusta Markus ja Mika. On ollut oikein ilo saada teidät vieraaksi tänne tänään. Tämä oli Tiedon äärellä, tietopolitiikasta tekoihin -podcast sarjan 15. jakso ja seuraava podcast-jakso on tarkoitus julkaista vielä kevään lopulla. Siis kiitos kaikille kuulijoille. Oikein hyvää kevään jatkoa ja kiitos Mika ja kiitos Markus.
Puhuja 2 [00:35:52]: Ja kiitos Hannalle myös.
Puhuja 1 [00:35:54]: Joo, kiitos kutsusta.
[äänite päättyy]