Uutiset

Parlamenttisampo antaa eduskunnan puhedatalle merkityksen

Tutkijat ovat kehittäneet datapalvelun ja portaalin, joka sisältää kaikki eduskunnassa pidetyt lähes miljoona puhetta vuodesta 1907 alkaen auttaakseen muita tutkijoita, toimittajia ja kansalaisia ymmärtämään sekä valvomaan parlamentaarista demokratiaa Suomessa.
Illustration of a person speaking on a microphone.
Eduskunnan puheet ja verkostot ovat tärkeää aineistoa tutkijoille. Kuva: Matti Ahlgren/Aalto-yliopisto.

Suomen eduskunta kokoontui ensimmäiseen täysistuntoonsa 23.5.1907 kahdensadan tuoreen kansanedustajan voimin, joiden joukossa oli myös maailman ensimmäiset 19 naiskansanedustajaa. Eduskunnan puhemiehen puuttuessa, täysistunnon avasi ikäpuhemies Iisakki Hoikka.

Hoikan puheen jälkeen eduskunnassa on pidetty yli 960 000 puhetta. Kaikkien puheiden lukeminen päivätyönä ja ilman taukoja kestäisi seitsemän vuotta ja neljä kuukautta. Lisäksi lukijan pitäisi ensin koostaa puheaineisto eri formaateista eduskunnan avoimen datan eri lähteistä.

Mitä jos kaikki puheet olisivat järjestetty yhteen verkkopalveluun, josta puheita olisi mahdollista tarkastella jäsennettynä kokonaisuutena ja kehittyneillä haku- ja analyysitoiminnoilla?

Vastauksen tarjoaa Parlamenttisampo, joka on linkitetyn avoimen datan verkkopalvelu ja tutkimusympäristö. Palvelu on kehitetty Semanttinen parlamentti -konsortiohankkeessa Aalto-yliopiston ja Helsingin yliopiston tutkijoiden toimesta. Mukana monitieteellisessä tutkimushankkeessa on myös Turun yliopiston Eduskuntatutkimuksen keskus.

”Parlamenttisampo tarjoaa tutkijoille, toimittajille sekä kansalaisille semanttisen webin teknologioihin pohjautuvan aineiston ja työkalun, jonka avulla on mahdollista tutkia eduskunnassa pidettyjä puheita ja eduskunnan verkostoja koko sen olemassaolon ajalta jäsennettynä kokonaisuutena”, sanoo Eero Hyvönen, Aalto-yliopiston professori ja HELDIG-keskuksen johtaja Helsingin yliopistosta. ”Se, että eduskunnan puheet tulevat helposti ja avoimesti kaikkien saataville verkossa, voi vaikuttaa siihen, miten eduskunnassa jatkossa puhutaan.”

Palvelusta selviää muun muassa, että puheliain kansanedustaja eduskunnassa on ollut Veikko Vennamo 12 600 puheella ja että lähes puolet ministeri Annika Saarikon keskeytyksistä kuluneella vaalikaudella ovat olleet Ben Zyskowiczin välihuutoja.

Parlamenttisampo yhdistää eduskunnan, oikeusministeriön sekä muiden tiedontuottajien aineistoa, jota käyttäjä voi tutkia palvelun käyttöliittymän avulla. Datan linkittäminen, rikastaminen ja jäsentäminen mahdollistaa muun muassa poliittisen toiminnan, retoriikan ja käsitteiden tutkimisen. Parlamenttisampo on myös keskeinen lisäys alati laajenevaan kansalliseen semanttiseen webiin ja digitaalisten ihmistieteiden tietoinfrastruktuuriin.

”Perinteinen verkko toimii verkkosivujen välisillä linkeillä”, kertoo Hyvönen. ”Semanttinen web toimii linkittämällä eri verkkosivujen perustana olevaa dataa keskenään. Tätä dataa voidaan rikastaa semanttisilla sisällöillä, jolloin kone pystyy lukemaan aineistoja ymmärtämällä yksittäisten sanojen ja laajempien kokonaisuuksien merkityksiä ja näin tarjoamaan enemmän ja parempaa tietoa verkon käyttäjille.”

”Jos haluamme edistää laskennallisia yhteiskuntatieteitä ja humanistisia tieteitä, tarvitsemme aineistoja, jotka tukevat menetelmiämme.”

Kimmo Elo, erikoistutkija, Eduskuntatutkimuksen keskus, Turun yliopisto.

Datan merkitys

Parlamenttisampo avautuu yleiseen käyttöön loppuvuodesta 2022, mutta palvelua kehittävässä tutkimuskonsortiossa sitä on hyödynnetty jo useassa tutkimuksessa.

”Tämä on Suomen mittakaavassa ainutlaatuinen hanke, koska nyt meillä on ensimmäistä kertaa koko eduskunta-aineisto koneluettavassa muodossa”, kertoo Kimmo Elo, joka toimii erikoistutkijana Turun yliopiston Eduskuntatutkimuksen keskuksessa. ”Eduskuntapuheet ovat erityisen tärkeää tutkimusaineistoa, koska ne edustavat kamppailuja mahdollisista poliittisista vaihtoehdoista. Jos haluamme edistää laskennallisia yhteiskuntatieteitä ja humanistisia tieteitä, tarvitsemme aineistoja, jotka tukevat menetelmiämme.”

Digitaalisten aineistojen kääntäminen koneluettavaan muotoon on tähän asti perustunut lähinnä yksittäisten tutkijoiden työhön. Suurten semanttisesti rikastettujen aineistojen avulla onkin mahdollista myös haastaa sekä tukea perinteistä politiikan tutkimusta.

”Tutkimusaiheet valikoituvat pitkälti siten, että jotain asioita nousee esiin tai tutkijalla on jokin vahva oma intressi keskittyä tiettyyn teemaan. Parlamenttisammon avulla on mahdollista kääntää tämä asetelma päälaelleen ja tehdä ensimmäistä kertaa aidosti eksploratiivista tutkimusta hyödyntämällä koko aikasarjaa”, kertoo Elo. ”Voimme esimerkiksi nähdä aihemallinnuksen avulla mitä kaikkea aineistossa on, mikä avaa ihan uudenlaisia mahdollisuuksia löytää uusia tutkimuskysymyksiä ja esittää uusia hypoteeseja.”

Politiikka-lehdessä ilmestyi hiljattain Parlamenttisammon dataa hyödyntävä artikkeli, jossa Elo ja Jenni Karimäki tutkivat ympäristöpolitiikan käsitteistön muutosta viimeisten 60 vuoden aikana. Tutkimuksen mukaan ympäristöpuheen määrä ja osuus kaikista puheista on kasvanut tasaisesti tarkastelujakson aikana. Lisäksi käsitteistö on muuttunut tarkemmin rajatusta luonnonsuojelun retoriikasta kohti ilmastonmuutoskeskeistä puhetta, joka on kokonaisvaltaisempaa ja sisältää lukuisia alateemoja.

Tutkimusprosessi oli oiva esimerkki siitä, miten tietotekniikka voi tukea politiikan tutkijoiden työtä. ”Laskennallisten metodien ensisijainen tehtävä ei ole niinkään tuottaa uutta tietoa, vaan ne voivat auttaa meitä löytämään sellaista, jota ei ole aiemmin havaittu”, kertoo Elo. ”Tässä artikkelissa me löysimme datasta ympäristökäsitteiden trendiomaisia kehityskulkuja ja Jenni – joka tuntee ympäristöteeman empirian tasolla – tulkitsi ympäristöpuhetta sen kontekstissa laadullisilla menetelmillä.”

Palveluun on tarkoitus sisällyttää myös eduskunnassa pidettävät uudet puheet lähes reaaliaikaisesti. Helsingin Sanomien toimittaja Sonia Zaki pääsi ensimmäisten joukossa käyttämään palvelun valmistellessaan Musta laatikko -esitystään.

”Puhuin esityksessäni eduskunnan puheliaimmista kansanedustajista sekä täysistuntopuheiden merkityksestä”, Zaki kertoo. ”Tällaista listaa ei ole koskaan ennen voinut julkaista, sillä se olisi vaatinut valtavasti manuaalista työtä. Parlamenttisampo on hyödyllinen työkalu etenkin politiikan toimittajille, koska sen avulla voi entistä helpommin seurata ja tarkastaa, mistä ja miten poliitikot ovat puhuneet eduskunnassa.”

Hyvönen toivoo myös, että sovelluskehittäjät löytävät työkalun ja keksivät uusia tapoja hyödyntää sen tarjoamaa avointa dataa.

Digitaalista tietoinfrastruktuuria rakentamassa

Hyvönen ja hänen kollegansa Semanttisen laskennan tutkimusryhmässä ovat kehittäneet kansallista semanttista verkkoa jo kahden vuosikymmenen ajan Sampo-mallin avulla. Aiemmat Sampo-järjestelmät ovat linkittäneet ja luoneet semanttisen pohjarakenteen muun muassa museoiden kokoelmille, suomalaisille sotahistoria-aineistoille, käsikirjoituksille ja kirjeille sekä elämäkerroille monien muiden aiheiden ohella.

Nämä linkitetyn avoimen datan palvelut ja semanttiset portaalit pohjautuvat kansalliseen semanttisen webin sisältöinfrastruktuuriin, joka on eräänlainen lähdekoodi suomen kielen käsitteiden merkityksille ja yhteyksille semanttisessa webissä.

”Työmme edustaa paradigmaattista muutosta tavassa julkaista aineistoja ihmistieteissä”, kertoo Hyvönen. ”Painetun tekstin ja internetin esiinnousun jälkeen olemme kolmannessa vaiheessa, jossa linkitetty data sekä siihen liittyvät työkalut ja sovellukset tulevat mahdollisiksi, kuten Parlamenttisammossa.”

Hyvönen vertaa semanttisen verkkoinfrastruktuurin kehitystyötä fyysisiin infrastruktuurihankkeisiin, joiden yhteiskunnallinen merkitys on ylisukupolvinen. Hänen visionsa ulottuu kuitenkin vielä pidemmälle.

”Neljäs vaihe olisi verkko, jossa palvelut eivät ole pelkästään työkaluja, vaan älykkäitä toimijoita, jotka auttavat ihmisiä löytämään sekä ratkaisemaan tutkimuskysymyksiä.”

Eero Hyvönen

Professor
  • Julkaistu:
  • Päivitetty:

Lue lisää uutisia

Uusi aiempaa herkempi infrapunasensori tuo hyötyjä moneen eri teknologiaan. Kuva: Aalto-yliopisto / Xiaolong Liu
Mediatiedotteet, Tutkimus ja taide Julkaistu:

Tutkijat kehittivät infrapunasensoreista aiempaa herkempiä

Uuden teknologian uskotaan olevan suoraan integroitavissa esimerkiksi itseohjautuviin autoihin.
Ryhmä ihmisiä poseeraa amfiteatterin suurilla kivirapuksilla. Rakennuksen takana on suuret ikkunat ja vihreä katto.
Tutkimus ja taide Julkaistu:

Aallon vuosi 2024: Avaruustutkimusta uusilla taajuuksilla, rakkauden aivokuvia, kaupunkivihreää ja paljon muuta

Aalto-yliopiston vuosi 2024 piti sisällään innovaatioita, inspiraatiota ja roppakaupalla radikaalia luovuutta – tässä katsaus siihen.
Radiokatu20_purkutyömaa_Pasila_Laura_Berger
Tutkimus ja taide Julkaistu:

Modernin arkkitehtuurin tutkimukseen merkittävä apuraha Koneen säätiöltä – Laura Bergerin hanke rinnastaa rakennuskadon luontokatoon

Aalto-yliopiston postdoc-tutkija Laura Berger ja hänen työryhmänsä ovat saaneet Koneen säätiön 541 400 euron apurahan hankkeen tutkimiseen, joka tarkastelee rakennuskadon vaikutuksia yhteiskunnalle ja ympäristölle.
Matti Rossi vastaanotti palkinnon
Palkinnot ja tunnustukset Julkaistu:

Professori Matti Rossille tiimeineen arvostettu AIS Impact Award 2024

Tiimi voitti palkinnon teknologisesta ja yrittäjyyteen liittyvästä vaikuttavuudesta