Tapahtumat

Väitös puhe- ja kieliteknologian alalta, DI Lauri Juvela

Väitöskirjan nimi on "Neural waveform generation for source-filter vocoding in speech synthesis".

Väitöstilaisuus järjestetään etäyhteydellä Zoomissa, jonne voi liittyä vapaasti. Linkki:  https://aalto.zoom.us/j/65354653468

Zoom pikaopas: https://www.aalto.fi/fi/palvelut/zoom-pikaopas

Väitöskirjan nimi on "Neural waveform generation for source-filter vocoding in speech synthesis".

Puhesynteesi on eräs puhekommunikaatioteknologian perustavista ongelmista ja nykyään puhesynteesiä käytetään kasvavassa määrin antamaan tekoälylle ääni koneen ja ihmisen välisessä puhevuorovaikutuksessa. Viime vuosina tilastollinen mallipohjainen synteesi on kehittynyt huomattavasti syvien hermoverkkojen ansi-osta ja synteesin luonnollisuus vastaakin jo lähes ihmispuhetta. Tärkeä tekijä tässä kehityksessä ovat hermoverkkoihin perustuvat aaltomuotoja syntetisoivat mallit, jotka ottavat perinteisen puhesynteesijärjestelmän vokooderin roolin.

Laadullisesta kehityksestä huolimatta viimeaikaisten “neurovokooderien" ja perinteisten signaalinkäsittelyyn perustuvien mallien välillä on aukko sekä ymmärryksessämme että uusien algoritmien laskennallisessa tehokkuudessa. Tämän väitöskirja yhdistää viimeisimpiä generatiivisia hermoverkkomalleja klassisiin signaalinkäsittelyn metodeihin ja kehittää näin algoritmisesti ymmärrettävää, korkealaatuista ja tehokasta puhesynteesiä.

Tämä väitöskirja kehittää uuden esitystavan puheen aaltomuotojen mallintamiseksi ja soveltaa generatiivisia kilpailevia hermoverkkoja (eng. generative adversarial networks, GAN) näiden aaltomuotojen synteesiin. Lisäksi väitöskirja esittää WaveNet-pohjaisen äänilähdemallin, jota sovelletaan korkealaatuiseen puhesynteesiin.

Vastaväittäjänä toimii Assistant Professor Gustav Henter, KTH Royal Institute of Technology, Ruotsi.

Kustos on professori Paavo Alku, Aalto-yliopiston sähkötekniikan korkeakoulu, signaalinkäsittelyn ja akustiikan laitos.

Väittelijän yhteystiedot: Lauri Juvela, tohtorikoulutettava, Aalto-yliopisto, 050 3790120, [email protected]

Elektroninen väitöskirjaVäitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä: https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/

  • Julkaistu:
  • Päivitetty: