Parlamenttisampo paljastaa, mitä eduskunnassa on puhuttu yli sadan vuoden aikana
Aalto-yliopiston ja Helsingin yliopiston tutkijat ovat kehittäneet avoimen tietopalvelun, joka sisältää kaikki eduskunnassa pidetyt lähes miljoona puhetta vuodesta 1907 alkaen. Koko aineisto on koottu semanttiseksi verkoksi, joka auttaa tutkijoita, toimittajia ja kansalaisia ymmärtämään parlamentaarista demokratiaa Suomessa.
Semanttinen verkko toimii linkittämällä eri verkkosivujen perustana olevaa dataa keskenään, kun perinteinen verkko toimii verkkosivujen välisillä linkeillä, selittää Aalto-yliopiston tietotekniikan professori Eero Hyvönen, joka toimii myös Helsingin yliopiston digitaalisten ihmistieteiden keskuksen HELDIG:n johtajana.
”Semanttisen verkon dataa voidaan rikastaa useiden eri lähdekantojen tiedoilla, jolloin kone pystyy lukemaan aineistoja ymmärtämällä yksittäisten sanojen ja laajempien kokonaisuuksien merkityksiä. Käyttäjälle voidaan näin tarjota tietoa niin, että myös tiedon kannalta tärkeä konteksti tulee esille.”
Parlamenttisampo voi kertoa esimerkiksi, kuka kansanedustaja on keskeyttänyt Sanna Marinin ja Annika Saarikon puheita eniten kuluneella vaalikaudella (Ben Zyskowicz). Tulevien eduskuntavaalien alla kansalaisia voi kiinnostaa, millaisista aiheista ja mistä alueista eri puolueiden nykyiset edustajat ovat puhuneet.
”Se, että eduskunnan puheet tulevat helposti ja avoimesti kaikkien saataville verkossa, lisää kansanedustajien työn läpinäkyvyyttä”, kertoo Hyvönen.
Hyvösen mukaan aineistojen helppo ja avoin saatavuus voi vaikuttaa siihen, miten eduskunnassa jatkossa puhutaan ja miten poliittista kulttuuria ja kieltä tutkitaan.
”Tämä on Suomen mittakaavassa ainutlaatuinen hanke, koska nyt meillä on ensimmäistä kertaa koko eduskunta-aineisto koneluettavassa muodossa”, kertoo Kimmo Elo, joka toimii erikoistutkijana Turun yliopiston Eduskuntatutkimuksen keskuksessa.
Elo ja erikoistutkija Jenni Karimäki hyödynsivät Parlamenttisammonkin pohjana toimivaa Finnparl-aineistoa tutkiessaan, miten ympäristökysymykset ovat politisoituneet eduskuntapuheessa. He analysoivat kaikki eduskunnan täysistunnoissa pidetyt puheenvuorot viimeisen 60 vuoden ajalta ja osoittivat selvän kasvun ympäristöretoriikan määrässä sekä vähemmälle huomiolle jääneitä puhetapojen muutoksia.
”Eduskuntapuheet ovat erityisen tärkeää tutkimusaineistoa, koska ne edustavat kamppailuja mahdollisista poliittisista vaihtoehdoista”, sanoo Elo. ”Ympäristökysymyksissä perinteisten suurpuolueiden puhetapa on vaihdellut kansalliskonservatiivisten arvojen sekä viherliberaalien arvojen välillä. Esimerkiksi keskustalla on ollut hyvinkin vihreää puhetta maatalousasioissa, mutta konservatiivista puhetta energia- ja luonnonsuojelupolitiikan kontekstissa.”
Sampo-tietopalvelut tuovat tiedon kaikkien ulottuville
Hyvösen johtama semanttisen laskennan tutkimusryhmä on jo vuosia kehittänyt erilaisia Sampo-palveluita, joiden tarkoitus on tuoda keskeisiä kansallisia tietoaineistoja tutkijoiden ja kaikkien kansalaisten käyttöön. Yksi hyvä esimerkki on talvi- ja jatkosotien aineistoja kokoava ja julkaiseva Sotasampo, jota on käyttänyt jo yli miljoona ihmistä.
”Sotasampo rekonstruoi automaattisesti sotilaiden sotapolun tai sotatarinan Kansallisarkiston, puolustusvoimien ja muiden tiedon tuottajien aineistoja linkittäen”, kertoo Hyvönen, joka on palkittu työstään opetus- ja kulttuuriministeriön tiedonjulkistamisen valtionpalkinnolla vuonna 2014.
Sammot tuovat eri tietokannoista yhdistettyä aineistoa yhteen paikkaan, jossa tietoa on helppo hakea, analysoida ja visualisoida. Esimerkiksi eduskunnan kaikki puheet löytyivät jo ennen Parlamenttisampoa digitoituina dokumentteina, mutta kokonaisuuden tutkiminen on ollut erittäin työlästä.
”Työmme edustaa paradigman muutosta tavassa julkaista ja tutkia ihmistieteiden aineistoja”, kertoo Hyvönen. ”Painetun tekstin ja internetin esiinnousun jälkeen olemme kolmannessa murrosvaiheessa, jossa linkitetty data sekä sitä hyödyntävät työkalut ja tekoälyn sovellukset tulevat mahdollisiksi.”
Parlamenttisampo.fi ja siihen liittyvät datapalvelut avataan tiistaina 14.2.2023 klo 13 alkavassa avoimessa julkistustilaisuudessa: https://seco.cs.aalto.fi/events/2023/2023-02-14-parlamenttisampo/
Parlamenttisampoon voit tutustua tilaisuuden jälkeen osoitteessa: https://parlamenttisampo.fi
Eero Hyvönen
- Julkaistu:
- Päivitetty: