Tutkimusdatan jakaminen ja julkaiseminen
Yleiskatsaus ja ohjeita tutkimusdatan julkaisemisen ja jakamisen palveluihin.
Yksi yleisimmistä teistä tutkimusdatan vaikeaselkoisuuteen on puutteellinen dokumentointi liittyen esimerkiksi käytettyihin menetelmiin, instrumentteihin ja muuttujiin. Yksinkertaisin tapa dokumentoida näitä tietoja on ns. README-tyylinen metatieto, joka tallennetaan datatiedostojen liitteeksi. Jos alallasi on tieteenalakohtaisia dokumentaatiomuotoja, on tärkeää käyttää niitä tutkimusdatan kuvauksen perustana. README-tiedoston sisältö voi olla seuraava.
Tiedostojen nimeäminen voi olla myös tietojen dokumentointitekniikka. Seuraava on yksinkertainen kaava tiedostojen nimeämiseen: "AR_21022022_XRD_sample01", jossa
Käytä esimerkiksi README-tyylisiä metatietotiedostoja kuvaamaan tiedostojen nimeämisjärjestelmää, mukaan lukien käytetyt lyhenteet. Sovi tutkimusryhmässäsi tutkimusdatan dokumentoinnin käytännöistä.
Aalto Science IT antaa opastusta tutkimusdatan kansiorakenteiden järjestämiseen yksittäisen ja useamman tutkijan projekteissa sekä puitteet tutkimusryhmän pitkäaikaisen master-hakemiston ylläpitämiseen. Aalto Science-IT:n ohjeiden mukaan yksi kansiorakenteiden keskeisistä näkökohdista on koodin tallentaminen datatiedostoista erillään. Katso Aalto Science-IT:n Datan organisaatiosivuilta lisää hyödyllisiä vinkkejä tiedon järjestämiseen.
On tärkeää valita yksi paikka tutkimustiedon säilytykseen. Hyödynnä Aalto IT:n tallennusratkaisuja, jotka mahdollistavat pääsyoikeuksien jakamisen, sillä tämä vähentää todennäköisyyttä, että eri tiedostoversioita muokataan eri paikoissa samanaikaisesti. Mieti, kenelle myönnetään pääsy tietoihin. Ole varovainen käsitellessäsi ja tallentaessasi henkilö- ja arkaluonteisia tietoja ja noudata IT:n tietosuojakäytäntöä ja ohjeita. Käytä tarvittaessa myös Aalto-versionhallintajärjestelmää ja Aalto Notebookia. Päätä tutkimusryhmäsi kanssa hakemistohierarkiasta ja käytetyistä tallennusratkaisuista.
Data-arkistot hyödyntävät erilaisia kuvailevia metadataelementtejä, joilla voi olla erilaisia nimityksiä. Tämä ohje kattaa yleisesti käytössä olevat metadataelementit. Ohjeessa käsitellään myös saatavuus- ja uudelleenkäyttöehtoja, jotka tulee yleensä määritellä tietoaineiston tallennuksen yhteydessä
Nimi on tärkein elementti, jonka avulla data löydetään ja joka auttaa tiedonhakijaa ratkaisemaan vastaako tutkimusdata-aineisto hänen tarpeitaan. Hyvä nimi on yksilöllinen ja kuvaa jaettavaa dataa. Vaikka aineisto liittyisi artikkeliin, kannattaa harkita erillisen nimen antamista datalle. Informatiivinen nimi kattaa aiheen, ajallisen kattavuuden sekä paikkaan ja maantieteelliseen sijaintiin liittyvät tiedot.
Ole tarkka ja kvantifioi mahdollisuuksien mukaan antaaksesi riittävästi tietoa datasta. Alla oleva tarkistuslista käsittää keskeiset kysymykset, joihin tiivistelmän tulee vastata.
Avainsanat eivät yleensä ole pakollisia. Niiden käyttö on kuitenkin erittäin suositeltavaa koska ne parantavat data-aineiston löydettävyyttä. Pohdi avainsanoja kohdeyleisöjen näkökulmasta. Etsi alakohtaisia avainsanoja esimerkiksi erikoissanastosta, jos sellainen on saatavilla. Käytä myös vapaasti valittavia avainsanoja ja fraaseja.
Pysyvä tunniste on data-arkiston tietoaineistolle antama yksilöllinen tunniste. Esimerkiksi DOI (Digital Object Identifier) ja URN (Uniform Resource Name) ovat yleisesti käytettyjä tunnisteita. Pysyvä tunniste antaa verkkoresurssille, esimerkiksi data-aineistolle, pysyvän "nimen" ja linkin. On tärkeää valita data-arkisto, joka tarjoaa pysyvän tunnisteen datan tallennuksen yhteydessä. Tunnisteen avulla data-aineisto voidaan yksilöidä, mikä mahdollistaa viittaamisen ja helpottaa datan uudelleenkäyttöä.
Yksi tärkeä ainakin yleisiin data-arkistoihin kuten Zenodoon liittyvä asia on versionhallinta. On aina mahdollista, että data-aineistoa päivitetään tulevaisuudessa tai siinä huomataan virhe. Ladattua aineistoa ei voi poistaa, mutta siitä voi ladata uuden version. Data-aineiston DOI pysyy samana, mutta versioilla on myös omat tunnisteensa.
Datan tallennuksen yhteydessä tulee määritellä tietoaineiston saatavuus. Yleensä data-arkistoissa määritellään ensin datan saatavuus ja sen jälkeen datan uudelleenkäyttöoikeudet lisensoimalla. Jotkut data-arkistot mahdollistavat useampia saatavuusvaihtoehtoja kuin toiset.
Avoin pääsy dataan | Tarkoittaa, että kuka tahansa saa käyttää, uudelleenkäyttää ja jakaa dataa vapaasti |
Data saatavilla embargon jälkeen | Tarkoittaa, että data on saatavilla tietyn päivämäärän jälkeen |
Rajoitettu pääsy/Luvanvarainen käyttö | Tarkoittaa, että dataa jaetaan tietyin ehdon. Uudelleenkäyttäjän on pyydettävä käyttöoikeuta, ja tietoaineiston tuottaja sallii tai evää pääsyn. |
Suljettu pääsy dataan | Tarkoittaa, että käyttäjillä ei ole pääsyä dataan. |
Käyttäjien oikeudet hyödyntää tallennettua data määritellään yleisesti lisensseillä. Lisenssi suojaa tekijänoikeuksia. Se varmistaa, että käyttäjä mainitsee tekijän dataan viitatessaan. Lisenssi vähentää myös epävarmuutta viestimällä käyttäjille, miten dataa voi uudelleenkäyttää, yhdistellä, louhia tai jakaa uudelleen. Creative Commons -lisenssit ovat vakiolisenssejä, joita käytetään tutkimusaineistojen käyttöehtojen määrittämiseen. CC BY 4.0 -lisenssi on pakollinen julkisesti rahoitetuille ja julkisesti datarepositoriossa saatavilla oleville dataseteille. Lisenssi täyttää ne vaatimukset, joita asettavat avoimen datan direktiivi ja kansallisesti sovellettava Laki julkisin varoin tuotettujen tutkimusaineistojen uudelleenkäytöstä.
Näillä linkeillä voit selata tutkimusdatan hallinnan ohjeita.
Yleiskatsaus ja ohjeita tutkimusdatan julkaisemisen ja jakamisen palveluihin.
Tutkimusdatan hyvä hallinta on osa laadukasta tutkimusprosessia ja luo kilpailuetua. Sivu kokoaa Aalto-yliopiston tuen, palvelut ja ohjeet tutkimusdatan hallintaan.