Väitös tietotekniikan alalta, FM Tommi Gröndahl
Milloin
Missä
Tapahtuman kieli
Kieliteknologia on yksi yleisimmistä tekoälyn muodoista. Yksi sen monista käyttötarkoituksista
on pyrkimys tunnistaa haitallista materiaalia, kuten valheita tai vihapuhetta.
Toisaalta tekstien luokittelu lisää mahdollisuuksia sensuurille ja yksityisyydenloukkauksille.
Tässä väitöskirjassa vertailen johtavia kieliteknologiamenetelmiä
erityisesti tietoturvan ja yksityisyydensuojan näkökulmasta. Keskityn kielen luokitteluun,
automaattiseen tuottamiseen sekä erilaisiin tapoihin käsitellä merkityssisältöä.
Esitän myös teknisiä parannuksia aiempiin menetelmiin.
Tulokset osoittavat, että tekstin luokittelu perustuu tyypillisesti melko yksinkertaisiin
piirteisiin, kuten tiettyjen sanojen läsnäoloon. Monimutkaiset koneoppimismallit jäävät
kiinni tällaisiin piirteisiin yhtä lailla kuin yksinkertaisemmat mallit. Tämä asettaa ne alttiiksi
hyökkäyksille, joissa pyritään sekoittamaan luokittelija ilman, että tekstin sisältöä
muutetaan merkittävästi. Tällaisella luokittelun väistämisellä voi toisaalta esimerkiksi
puolustautua kirjoittajan tunnistamista vastaan, millä saattaa olla merkittäviä seurauksia
kirjoittajan yksityisyydelle ja turvallisuudelle.
Teknisestä näkökulmasta vertailen syväoppivia neuroverkkoja perinteisempiin sääntöpohjaisiin
menetelmiin. Näiden väliltä löytyy suuria eroja, joiden hyödyt ja haitat
ovat usein vastakkaisia. Vaikka neuroverkot kykenevät käsittelemään kielidataa
paljon laajemmin kuin käsin ohjelmoidut säännöt, niillä on vaikeuksia säilyttää merkityssisältöä
yksityiskohtaisesti. Siksi neuroverkot yksin eivät ole aina optimaalinen
ratkaisu, ja oleellista on yhdistää eri menetelmien parhaat puolet.
Vastaväittäjä: professori Jörg Tiedemann, Helsingin yliopisto, Suomi
Kustos: Professori N. Asokan, University of Waterloo / Aalto-yliopiston perustieteiden korkeakoulu, Tietotekniikan laitos
Tohtoriopiskelijan yhteystiedot: [email protected]
Väitöstilaisuus järjestetään etäyhteyden (Zoom) kautta. Linkki tilaisuuteen.
Väitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä Aalto-yliopiston julkaisuarkiston verkkoriiputussivulla.
Elektroninen väitöskirja. (aaltodoc.aalto.fi)
- Julkaistu:
- Päivitetty: