Koneoppimisella voidaan ennustaa opiskelijan valmistuminen 74% todennäköisyydellä
Tietotekniikan opiskelija Lauri Viitasen lopputyössä sovelletaan elinaikamalleja Metropolia ammattikorkeakoulun opintorekisterin tietoihin, tavoitteena löytää muuttujia, jotka parhaiten erottelevat valmistuvat opiskelijat keskeyttävistä, sekä lisäksi tarkimmin ennakoivat jäljellä olevaa opintoaikaa.
- Lopputyössäni teen mallin, joka ennakoi Metropolia AMK:n opiskelijoiden valmistumisajankohtaa ensimmäisen vuoden opintomenestyksen ja muiden selittävien tekijöiden perusteella. Mallissa selittäviä tekijöitä ovat muun muassa ikä, sukupuoli, edellisen opiskeluoikeuden koulutusala, opintojen aloitusajankohta, ensimmäisenä vuonna kertyneet opintopisteet ja suoritusten painotettu keskiarvo, kertoo Viitanen.
Lopputyössä opiskelijat luokiteltiin käyttämällä naiivia Bayesilaista luokittelijaa, yleistettyä lineaarista mallia, tukivektorikoneluokittelijaa ja Gaussista prosessia. Gaussisia prosesseja ei ole vastaavaan aineistoon sovellettu aikaisemmin. Vaikka elinaikamallit soveltuvat tämän kaltaisiin pitkittäistutkimuksiin erinomaisesti, Gaussisilla prosesseilla voi laajentaa niitä joustavimmiksi. Olisi hyödyllistä tutkia, kuinka paljon lisääntynyt joustavuus täsmälleen parantaisi tarkkuutta.
- Työssäni vertailen myös tavanomaisempien koneoppimismenetelmien tarkkuutta luokittelemaan opiskelijat heti ensimmäisen vuoden jälkeen joko sellaisiin, jotka lopulta valmistuvat tai sellaisiin, jotka keskeyttävät opintonsa, kertoo Viitanen.
Parhaalla koneoppimismenetelmällä, tukivektorikoneella, saavutetaan 74 % tarkkuus, eli kolmen opiskelijan kohdalla neljästä arvioidaan tuleva opiskeluoikeuden päättyminen oikein jo ensimmäisen vuoden opintojen jälkeen. Ylimääräisten opintopisteiden suorittaminen ensimmäisenä vuonna kasvattaa enemmän valmistumisen todennäköisyyttä kuin yhden numeron parannus keskiarvossa. Opintopistekertymän vaikutusta valmistumiseen, suhteessa muihin tekijöihin, ei ole aikaisemmin tutkittu.
- Metropolia AMK:ssa lopputyön tuloksia aiotaan hyödyntää budjetin suunnittelussa, sillä epätarkka valmistumisajankohdan arviointi vaikeuttaa tulevan rahoituksen ennakointia. Opiskelijakohtaisella mallilla on tarkoitus saada virhettä alaspäin. Tuloksia aiottaneen hyödyntää myös opiskelijan työpöydässä siten, että opinto-ohjaajat ja ryhmien vetäjät havaitsevat helposti ne opiskelijat, joiden opintojen etenemiseen heidän kannattaisi kiinnittää eniten huomiota, arvioi Viitanen tutkimuksen hyödyntämismahdollisuuksia.
Tutkimuksen tulokset ovat linjassa aiempien tutkimusten kanssa: arvosanojen keskiarvo ja opiskelijan sukupuoli ovat merkitseviä muuttujia valmistumistodennäköisyyden arvioinnissa. Tytöt valmistuvat poikia todennäköisemmin ja nopeammin kaikkialla, oppiaineesta riippumatta. Oppilaan ikä vaikuttaa valmistumistodennäköisyyksiin negatiivisesti sekä tässä että lähes kaikissa aiemmin tehdyissä tutkimuksissa.
Lisätietoja:
Lauri Viitanen
[email protected]
Pekka Marttinen
[email protected]