Väitös tietotekniikan alalta, M.Sc. Mohammadreza Mohammadnia Qaraei
Väitöskirjan nimi: Efficient and robust algorithms for extreme multilabel classification
Tohtoriopiskelija: Mohammadreza Mohammadnia Qaraei
Vastaväittäjä: apulaisprofessori Grigorios Tsoumakas, Aristotle University of Thessaloniki, Kreikka
Kustos: apulaisprofessori Pekka Marttinen, Aalto-yliopiston perustieteiden korkeakoulu, tietotekniikan laitos
Monet tosielämän ongelmat voidaan nähdä luokittelutehtävinä, joita koneoppimisalgoritmit pyrkivät automatisoimaan. Esimerkiksi sähköpostin tunnistaminen roskapostiksi tai asiakaspalautteen luokittelu positiiviseksi, neutraaliksi tai negatiiviseksi ovat luokittelutehtäviä. Näissä esimerkeissä syötteeseen, kuten sähköpostiin tai palautetekstiin, liitetään tunniste, eli syöte asetetaan yhteen luokkaan pienestä määrästä vaihtoehtoisia luokkia. Jotkin luokittelutehtävät ovat kuitenkin huomattavasti monimutkaisempia ja sisältävät satoja tuhansia tai miljoonia mahdollisia luokkia, jolloin yhdellä syötteellä voi olla useita tunnisteita. Näitä ongelmia kutsutaan äärimmäiseksi moniluokkatunnistukseksi (extreme multilabel classification, XMC).
Tosielämän esimerkkejä XMC-ongelmista ovat tuotteiden suosittelujärjestelmät, joissa tiettyä tuotetta tarkasteltaessa suositellaan lisäksi muutamia muita tuotteita miljoonien mahdollisten joukosta, tai pitkien tekstien, kuten Wikipedia-artikkeleiden, luokittelu joihinkin suuresta määrästä tunnisteita. Tämä väitöskirja tarkastelee kahta keskeistä haastetta XMC:ssä: laskennallista tehokkuutta ja virheiden sietokykyä (robustness). Ensimmäinen näistä haasteista koskee laskutoimitusten suorittamista tehokkaasti ja tallennustilan hallintaa, kun luokkia on paljon. Tämä väitöskirja esittelee menetelmän mallin koon pienentämiseksi ja koulutuksen nopeuttamiseksi siten, että luokittelutarkkuus säilyy parhaiden olemassa olevien menetelmien tasolla.
Suuri tunnisteavaruus aiheuttaa myös muita ongelmia, kuten puuttuvia tunnisteita tai luokkien epätasapainoa. Väitöskirja esittelee menetelmiä nykyisten XMC-algoritmien sietokyvyn parantamiseksi näitä ongelmia vastaan.
Eräs koneoppimisen haaste on mallin sietokyvyn vahvistaminen sellaisia syötteitä vastaan, jotka on tarkoituksellisesti suunniteltu hämäämään mallia. Tällaisia syötteitä kutsutaan termillä hyökkäyssyöte (adversarial example). Väitöskirja tarkastelee hyökkäyssyötteiden luomista XMC-tekstiaineistoissa, arvioi XMC-mallien sietokykyä näitä vastaan ja tarkastelee menetelmiä mallien sietokyvyn parantamiseksi.
Tiivistetysti tämä väitöskirja esittelee menetelmiä XMC-mallien laskennallisen tehokkuuden lisäämiseksi, luokittelutarkkuuden parantamiseksi ja sietokyvyn vahvistamiseksi. Näillä tuloksilla on merkittäviä vaikutuksia sovelluksissa, joissa käsitellään laajoja tunnisteavaruuksia ja moniluokkatietoja, kuten suosittelujärjestelmissä ja asiakirjojen luokittelussa.
Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 10 päivää ennen väitöstä): https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/
Perustieteiden korkeakoulun väitöskirjat: https://aaltodoc.aalto.fi/handle/123456789/52
- Julkaistu:
- Päivitetty: