Miten avoin data muuttaa maailmaa? Konferenssi keräsi yli 600 ihmistä keskustelemaan aiheesta Otaniemeen
Research Data Alliance (RDA) -järjestön kolmipäiväinen yleiskokous toi viime viikolla Otaniemeen 620 eri alojen asiantuntijaa keskustelemaan avoimesta datasta ja siihen liittyvistä käytännöistä. Alun perin järjestäjien tavoitteena oli houkutella paikalle 500 osallistujaa, joten tavoite ylittyi reilusti. Konferenssin keskeisenä teemana oli, miten avoin data muuttaa esimerkiksi työskentelytapoja ja päätöksentekoa ja miten data saadaan vastaamaan sille asetettuihin odotuksiin.
RDA:lla on tällä hetkellä noin 9300 jäsentä. Se tuo yhteen datatieteen ja datanhallinnan osaajia eri aloilta sekä päättäjiä keskustelemaan data-aineistojen avaamisen käytännön haasteista ja etsimään niihin ratkaisuja. Työskentely tapahtuu työryhmissä, joiden tavoitteena on tuottaa konkreettisia teknisiä ja hallinnollisia suosituksia. Puolivuosittaisissa yleiskokouksissa ryhmät kokoontuvat raportoimaan työn etenemisestä ja saamaan siitä palautetta.
Yleiskokous järjestettiin nyt ensimmäistä kertaa Suomessa. Tapahtuma oli Tieteen tietotekniikan keskus CSC:n, Aalto-yliopiston, Helsingin yliopiston, Ilmatieteen laitoksen, Tieteellisten Seurain Valtuuskunnan ja RDA Europe 4.0-projektin yhdessä järjestämä. Aallosta konferenssia olivat järjestämässä tietotekniikan laitoksen professori Pekka Orponen, tutkimuspalveluiden päällikkö Ella Bingham sekä palvelupäällikkö Anne Sunikka tiimeineen.
”Yksi työryhmätyössä tällä hetkellä näkyvä tärkeä teema on hyvän aineistonhallinnan tuominen osaksi arkista tutkimuskulttuuria laadukkaiden palvelujen, tutkijoiden koulutuksen ja muun osaamistuen sekä ansioiden tunnistamisen kautta”, sanoo professori Orponen.
Häntä kiinnosti konferenssissa muun muassa tutkimusrahoittajaryhmän sessio, jossa pohdittiin parhaita käytäntöjä muodostaa yleiskuva avointen data-aineistojen kokonaisuudesta esimerkiksi koneellisten aineistonhallintasuunnitelmien avulla.
Toinen Orposen mielestä kiinnostava tapahtuma oli sessio, jossa suunniteltiin indikaattoreita data-aineistojen avoimuuden FAIR-kypsyystason määrittämiseksi. Lyhennys FAIR tulee sanoista findable, accessible, interoperable ja reusable. FAIR-ehdot täyttävä data on siis löydettävissä ja saavutettavissa. Se noudattaa yhteentoimivuuden periaatteita ja sitä pystytään käyttämään uudelleen.
Koulutus on avainasemassa
Konferenssin torstaina pidetyn paneelikeskustelun keskiössä oli kysymys, millä tavoin data muuttaa maailmaa. Siihen osallistui eri alojen asiantuntijoita: työministerin valtiosihteeri Pilvi Torsti, Teknologiateollisuuden yhteydessä toimivan Tekoälykiihdyttämön vetäjä Alexander Törnroth, EU:n Open Science Policy Platform -neuvottelukunnan puheenjohtaja Eva Mendez ja johtaja George Strawn Yhdysvaltain kansallisesta tiedeakatemiasta. Keskustelua moderoi Yleisradion toimittaja Heikki Valkama.
Torsti nosti mullistavina asioina esiin muun muassa sen, että dataa syntyy enemmän kuin koskaan aiemmin, sille on paljon säilytyskapasiteettia ja sitä voidaan analysoida monenlaisilla työkaluilla. Törnroth huomautti, että yrityksillä on entistä enemmän osaamista sen suhteen, miten dataa voidaan hyödyntää.
Torstin mukaan dataa hyödyntäville organisaatioille iso ongelma on saatavilla olevan datan laatu. Hän vertasi dataa veteen: joissain tilanteissa se voi olla täysin hyödytöntä, mutta kun sitä käytetään oikeaan tarkoitukseen ja oikealla hetkellä se voi hyvinkin hyödyllistä.
Keskustelijat muistuttivat myös siitä, että datan keskeinen ominaisuus on se, että sitä voi jakaa avoimesti muillekin: avoin jakaminen ei tarkoita sitä, että sen omistajan itsensä täytyisi siitä luopua.
Torsti otti esiin koulutuksen merkityksen maailman muuttamisessa. Eva Mendez yhtyi näkemykseen: "Puhutaan diginatiiveista, mutta kun olin pieni lapsi, meillä oli kotona kirjoja, joiden sivuja osasin kääntää. Ei se tarkoittanut, että olisin osannut lukea."
Myös tiedeyhteisön on kyettävä oppimaan uutta, sillä olemme tieteellisen vallankumouksen kynnyksellä. "Ennen gigatavun tallentaminen maksoi miljoonan, nykyään kaksi senttiä", huomautti Strawn. Hänen mukaansa avoimuudella on keskeinen rooli murroksessa. Tutkimusdatan ei pidä antaa luisua kaupalliseen hallintaan kuten tiedejulkaisujen kohdalla on tapahtunut, hän sanoi.
”Euroopan vahvuuksia ovat avoimuus, läpinäkyvyys ja laillisuusperiaate”
Konferenssin keskiviikon avajaistilaisuudessa puhuivat johtaja Andreas Veispak Euroopan komissiosta, RDA:n pääsihteeri Hilary Hanahoe, Suomen Akatemian pääjohtaja Heikki Mannila ja Helsingin yliopiston apulaisprofessori Tuuli Toivonen.
Veispakkertoi unionin digitaalisten sisämarkkinoiden kehittämisen painopisteistä. Hän nosti esiin EuroHPC-ohjelman ja Suomeen sijoitettavan huippuluokan datainfrastruktuuri LUMIn esimerkkinä merkittävästä eurooppalaisesta digitalisaatiota tukevasta julkisesta investoinnista.
EuroHPC avaa uusia mahdollisuuksia osaamisen kehittämiselle, huippututkimukselle sekä datapohjaisen liiketoiminnan, kuten alustatalouden ja tekoälyn, kehittämiselle. "Euroopan vahvuuksia ovat avoimuus, läpinäkyvyys ja laillisuusperiaate, jotkaovat Euroopan DNA:ssa", Veispak painotti tilaisuudessa.
EU satsaa dataintensiiviseen tutkimukseen myös avoimen tieteen pilvipalvelun (European Open Science Cloud) kautta. Tavoitteena on luoda kattava eurooppalainen palveluympäristö julkisesti rahoitetun tutkimuksen tulosten saattamiseksi yhteiseen käyttöön.
"Datan pitkäaikaissäilytys on velvollisuutemme tulevia sukupolvia kohtaan. Emme tiedä, mitä datalla tehdään 50 vuoden kuluttua, mutta varmuudella enemmän kuin osaamme tehdä tänään", Veispak sanoi.
Konferenssin aiheista keskusteltiin vilkkaasti myös sosiaalisen median palvelu Twitterissä. Keskusteluihin voi jälkikäteenkin tutustua käyttämällä RDAPlenary- ja RDAPlenary14-aihetunnisteita.
Lue myös:
Uudet teknologiat kaipaavat johtajuutta, eivät lakeja (CSC:n tiedote torstain paneelikeskustelusta)
Eurooppa käyttää kolmasosan maailman laskentakapasiteetista mutta tuottaa siitä vain 2 % (CSC:n tiedote keskiviikon avajaistilaisuudesta)
- Julkaistu:
- Päivitetty: