Kohti parempaa puheentunnistusta: Lahjoita puhetta -kampanja palkittiin parhaana mobiilipalveluna
Onnistuneen kampanjan vuoksi Suomella on mahdollisuus toimia puheentunnistuksen pienten kielten pioneerina, kertoo professori Mikko Kurimo.
Lahjoita puhetta -hanke voitti PRIX EUROPA 2021 -festivaaleilla Best European Digital Audio Project of the Year 2021 -palkinnon. PRIX EUROPA on tapahtuma, jonka perustivat Euroopan parlamentti, Euroopan komissio ja Euroopan kulttuurisäätiö vuonna 1987. Tapahtumassa palkitaan eurooppalaisia televisio-, radio- sekä digitaalisen median tuotantoja.
Lahjoita puhetta -kampanjan tavoitteena on kerätä mahdollisimman paljon erilaista puhuttua suomea. Lahjoitetun puheen avulla kehitetään puheentunnistusta ja tekoälyä ymmärtämään paremmin suomenkielistä puhetta. Hankkeessa ovat mukana esimerkiksi Yle, Helsingin yliopisto, Valtion kehitysyhtiö Vake (nyk. Ilmastorahasto) sekä Aalto-yliopisto. Puhetta voi lahjoittaa tietokoneen selaimella tai puhelinsovelluksella. Tutustu kampanjaan tarkemmin täällä.
Puheentunnistuksen tutkimusryhmää Aalto-yliopistossa johtaa professori Mikko Kurimo, joka on ollut mukana hankkeessa alusta asti. Professori Kurimo kertoo, että suomi ja suurin osa maailman 6000 kielestä kärsii samasta ongelmasta – puheentunnistusta hyödyntäviä palveluita ei ole saatavilla, vaan niiden käyttö edellyttää sujuvaa englannin kielen osaamista.
Hän uskookin, että onnistuneesta ja palkitusta konseptista voivat ottaa mallia myös muutkin pienet kielet ja maat.
"Keräys on ollut suuri menestys. Osallistujia on ollut paljon, tekniikka on pelannut ja kerätty data on osoittautunut erittäin tärkeäksi. Tällaista julkisen televisioyhtiön vetämää ja markkinoimaa ja täysin virtuaalista keräyskampanjaa, josta kieliteknologiaa kehittävät yrityksetkin hyötyvät, ei ole tietääkseni ennen missään päin maailmaa edes yritetty", professori Kurimo kertoo.
Nyt kun puhetta on saatu kokoon noin 4000 tuntia, Kurimon tutkimusryhmä työskentelee suuren urakan kanssa, jossa ryhmä kehittää erilaisia automaattisia menetelmiä aineiston tarkasteluun, korjaamiseen, kuvaamiseen ja luokitteluun. Aineistosta on litteroitu jo noin 1500 tuntia ja sen avulla on jo nyt pystytty kehittämään parempi suomen kielen puheentunnistin. Lisäksi ryhmä on aineiston avulla tehnyt tunnistimia, joilla voidaan tunnistaa puhujan ikä, sukupuoli ja murre.
"Tunnistimien avulla voidaan tutkia esimerkiksi sitä, palveleeko nykyinen tekoäly paremmin joitain ihmisryhmiä kuin toisia ja miten siitä voisi tehdä tasa-arvoisempaa", professori Kurimo kertoo.
Lahjoita puhetta -kampanja on palkittu jo useasti. Huhtikuussa 2021 hanke sai Grand One -mediapalkinnon kategoriassa Paras mobiilipalvelu, ja lokakuussa 2021 Helsingin yliopisto myönsi hankkeelle ja Kielipankille avoimen tieteen palkinnon. Voit lukea aiheesta lisää täältä.
Parannetaan yhdessä suomenkielistä puheentunnistusta! Kampanja on edelleen käynnissä – lahjoita puhetta osoitteessa lahjoitapuhetta.fi!
Lahjoita puhetta -hanke palkittiin aiemmin myös parhaana mobiilipalveluna.
Onnistuneen kampanjan vuoksi Suomella on mahdollisuus toimia puheentunnistuksen pienten kielten pioneerina, kertoo professori Mikko Kurimo.