Tag Archives: tutkimusaineistot

Näin anonymisoit kvantitatiiviset aineistosi

Ihmistieteiden tutkimusaineistot sisältävät aina enemmän tai vähemmän henkilötietoja. Henkilötietolain mukaan tunnisteellista aineistoa voi käyttää tutkimukseen, jos se on välttämätöntä, tarkoituksenmukaista, suunniteltua ja asiallisesti perusteltua. Tutkittavia koskevat tiedot eivät kuitenkaan missään tapauksessa saa vuotaa ulkopuolisille.

Viimeistään aineiston arkistointivaiheessa tunnisteet täytyy hävittää, jos tunnisteellisen aineiston arkistoimiseen ei ole erillistä Kansallisarkistolta anottua lupaa. Useimmat suomalaiset yliopistot ja tutkimusrahoittajat kannustavat aineistojen arkistoimiseen ja avaamiseen, eli anonymisointiosaaminen alkaa kuulua jokaisen tutkijan perustaitoihin.

Anonymisointikoulutukselle onkin Suomessa selvästi tarvetta, sillä Tietoarkiston ja ATT-hankkeen huhtikuussa Tampereella järjestämään Tutkimusaineistojen anonymisointi -seminaariin ilmoittautui lähes 350 osallistujaa ympäri maata.

Seminaarin esitysdioihin voi tutustua verkossa tapahtuman sivuilla, ja myös esityksistä kuvatut videot ovat tulossa julki samalle sivulle.

Tässä blogikirjoituksessa käyn seminaariesitysten perusteella läpi määrällisen aineiston anonymisointikäytäntöjä. Kun oman aineiston anonymisointi tulee ajankohtaiseksi, yksityiskohtaisempia ohjeita kannattaa käydä lukemassa vielä Tietoarkiston Aineistonhallinnan käsikirjasta.

Tietoarkistossa toivomme, että meille toimitettavat aineistot ovat valmiiksi anonymisoituja. Tarkastamme kuitenkin kaikki aineistot, ja käsittelemme niitä usein vielä jonkin verran niin, että Ailassa julkaistavat aineistot ovat varmasti täysin anonyymeja.

Kaikki elävää ihmistä koskevat tiedot ovat henkilötietoja

Aivan ensimmäiseksi tunnisteellista aineistoa anonymisoivan tutkijan täytyy ymmärtää, mitkä tiedot ovat henkilötietoja. Tätä aihetta avasi seminaarissa Tietoarkiston kehittämispäällikkö Arja Kuula-Luumi.

Tiivistetysti voi sanoa, että henkilötiedoiksi lasketaan kaikki elävää ihmistä koskevat tiedot. Sellainen voi olla esimerkiksi tutkittavan tai tämän läheisen ominaisuus, tutkittavan elinolosuhteita koskeva maininta tai vaikkapa tutkittavan mielipide.

Tämä ei onneksi kuitenkaan tarkoita, että esimerkiksi kaikki tutkittavan esittämät mielipiteet pitäisi poistaa aineistosta ennen kuin sen voi arkistoida. Tutkittavia koskevat tiedot lasketaan henkilötiedoksi vain silloin, kun yksilö on tunnistettavissa aineistosta. Aineiston anonymisoiminen tarkoittaakin sitä, että aineistosta poistetaan, luokitellaan tai muutetaan sellaiset tiedot, joiden avulla yksilön voi tunnistaa ja esimerkiksi aineistossa esitetyt mielipiteet yhdistää tietyn yksilön mielipiteiksi.

EU:n uuden tietosuoja-asetuksen mukaan henkilö on tunnistettavissa silloin, kun hänet voidaan tunnistaa suoraan tai epäsuorasti tunnistetietojen perusteella. Käytännössä suorat tunnistetiedot tarkoittavat tietoja, jotka riittävät yksin henkilön tunnistamiseen, vaikka hänestä ei kerrottaisi mitään muuta. Suoria tunnisteita ovat siis esimerkiksi koko nimi ja henkilötunnus.

Epäsuorat tunnisteet on jaoteltu vahvoihin epäsuoriin tunnisteisiin ja epäsuoriin tunnisteisiin. Vahvat epäsuorat tunnisteet eivät viittaa suoraan henkilöön, mutta niiden avulla voi helposti selvittää, kenestä henkilöstä on kyse. Vahva epäsuora tunniste voisi siis olla esimerkiksi auton rekisterinumero, jonka avulla on mahdollista suoraan selvittää auton omistaja.

Epäsuorat tunnisteet eivät yksin paljasta henkilöllisyyttä, mutta saattavat muihin tietoihin yhdistettynä mahdollistaa henkilön tunnistamisen. Tällaisia ovat esimerkiksi ikä, sukupuoli ja asuinpaikka sekä lukuisat muut fyysiset, psyykkiset, taloudelliset ja sosiaaliset tekijät.

Tunnistettavuutta miettiessä on olennaista ottaa huomioon myös se, mitä tietoja henkilöstä on saatavilla muualta kuin omasta aineistosta. Moni paljastaa itsestään paljon sosiaalisessa mediassa. Lisäksi esimerkiksi julkiset asiakirjat ja järjestöjen verkkosivut voivat tarjota monenlaisia tietoja.

Tietoarkiston kehittämispäällikkö Arja Kuula-Luumi piti seminaarissa esityksen aiheesta Tietosuoja tutkimuksessa. (Kuva: Kaisa Järvelä).

Anonymisointi on aina peruuttamaton

Yksi olennainen asia on ymmärtää, että aineiston pseudonymisointi ja anonymisointi ovat eri asioita. Jos tutkijat analysoivat aineistoa ilman tunnisteita, mutta säilyttävät tunnistetiedot ja koodiavaimen itsellään, aineisto ei ole anonyymi vaan pseudonyymi, eikä sitä voi esimerkiksi arkistoida sellaisenaan jatkokäyttöä varten.

Lain mukaan aineisto on anonyymi vasta silloin, kun siitä ei voi tunnistaa yksittäisiä tutkittavia millään kohtuullisesti toteutettavissa olevalla keinolla. Tietosuoja-asetuksen mukaan kohtuullisuutta tulee arvioida tunnistamisesta aiheutuvien kulujen, tunnistamiseen tarvittavan ajan ja käytettävissä olevan teknologian näkökulmista.

EU:n tietosuojatyöryhmä neuvoo arvioimaan aineiston tunnisteellisuutta kolmesta näkökulmasta:

  1. Onko yksilö edelleen mahdollista erottaa joukosta?
  2. Onko tietojen yhdistäminen yksilöön mahdollista?
    ja
  3. Voidaanko yksilöä koskevat tiedot päätellä?

Tietoarkiston tutkimusamanuenssi Eliisa Haanpää konkretisoi kysymyksiä vielä kolmella esimerkillä:

  1. Pystyykö yksittäisen henkilön tunnistamaan vastauksista, kun on tiedossa, että hän on vastannut kyselyyn?
  2. Pystyykö vastaukset yhdistämään henkilöön, vaikka ei tiedä, onko hän vastannut kyselyyn?
  3. Paljastaako esimerkiksi tietyn paikallisradion kuuntelemisen kaltainen yksityiskohta, että henkilö asuu tietyssä kunnassa?

Anonyymin aineiston määritelmän kannalta on olennaista myös se, että anonymisointitoimien täytyy olla peruuttamattomia. Kertaalleen anonymisoitu aineisto ei siis saa olla palautettavissa tunnisteelliseen muotoon.

Tietoarkiston tutkimusamanuenssi Eliisa Haanpää kertoi kvantitatiivisten aineistojen anonymisoinnista sekä teoreettisella tasolla että konkreettisten aineistoesimerkkien avulla. (Kuva: Kaisa Järvelä).

Anonymisointi alkaa tarkasta suunnittelusta

Eliisa Haanpäällä on vuosien kokemus erilaisten kvantitatiivisten aineistojen anonymisoimisesta. Hän korostikin seminaariesityksessään, että kaikkiin aineistoihin suoraan sovellettavaa anonymisointimallia ei ole olemassa, vaan yksittäiset toimet täytyy viime kädessä suunnitella kunkin aineiston ehdoilla. Tutkijan on siis punnittava aina erikseen, mitkä käytännöt toimivat parhaiten juuri oman aineiston kohdalla. Oman aineiston anonymisointia suunnitellessa kannatta pohtia esimerkiksi, kuinka arkaluontoinen aineisto on, ja mitä aihetta se käsittelee, eli mitkä tiedot on olennaista säilyttää, jotta aineisto pysyy ymmärrettävänä.

Jotta anonymisoiminen sujuisi alusta loppuun asti loogisesti, Haanpää neuvoi laatimaan kirjallisen anonymisointisuunnitelman, jonka mukaisesti johdonmukainen anonymisointi on helppo toteuttaa. Hyvä perusmalli on anonymisoida ensin taustamuuttujat, seuraavaksi mahdolliset avokysymykset ja lopuksi vielä muita tunnisteita sisältävät muuttujat sekä mahdolliset muut aineistoon liittyvät lisämateriaalit.

Kolme yleisintä tapaa anonymisoida kvantitatiivista aineistoa

Määrällisen aineiston kohdalla kolme yleisintä anonymisointikeinoa ovat muuttujan poistaminen, arvojen luokittelu ja tunnisteiden poistaminen avokysymysten vastauksista.

Muuttuja on järkevää poistaa aineistosta kokonaan silloin, kun siinä on paljon tunnisteita. Käytännössä muuttujan käsittelemiseen vaikuttaa se, millaisia tunnisteita se sisältää. Suorat tunnisteet ja vahvat epäsuorat tunnisteet, siis esimerkiksi nimet, henkilötunnukset tai auton rekisterinumerot tulee poistaa kokonaan. Epäsuorien tunnisteiden, kuten vastaajan iän, asuinkunnan ja sukupuolen kohdalla on arvioitava tapauskohtaisesti kannattaako ne poistaa tai luokitella vai onko ne turvallista jättää aineistoon.

Arvojen luokittelemiseen on olemassa kaksi keskenään hieman erilaista mallia. Ensimmäisessä, perusluokittelumallissa vastaukset yhdistetään järjestäen luokiksi. Yleinen käytäntö on yhdistää esimerkiksi vastaajien iät viiden ikävuoden luokiksi tai työt ammattiryhmiksi.

Toinen yleinen luokittelumalli on arvojen harkinnanvarainen luokittelu. Se tarkoittaa, että vastauksista poistetaan tai karkeistetaan harvinaisia ääriarvoja. Jos esimerkiksi kyselyssä on mukana vain vähän iäkkäitä vastaajia, heidät voidaan yhdistää yhdeksi yli 50-vuotiaiden luokaksi.

Luokkia ei kannata yrittää keksiä itse, vaan apuna on hyvä käyttää Tilastokeskuksen vakiintuneita luokittelumalleja. Tilastokeskuksen luokitukset on suunniteltu huolella sellaisiksi, että ne ovat mahdollisimman yleisiä, mutta kuitenkin informatiivisia.

Kolmas yleinen anonymisointikeino on tunnisteiden poistaminen avokysymysten vastauksista. Tämä on tarpeen, jos tutkittavat ovat antaneet esimerkiksi harrastuksia koskeviin avokysymyksiin niin yksityiskohtaisia vastauksia, että heidät voi niiden perusteella tunnistaa.

Avokysymysten vastauksia ei yleensä tarvitse poistaa kokonaan, vaan niistä voi poimia yksittäisiä tunnisteellisia pätkiä, ja muuttaa ne anonyymimpään muotoon. Jos vastaaja esimerkiksi mainitsee asuvansa Humppilassa, vaikka vastaajan kotikunta ei saisi selvitä aineistosta, kunnan nimen voi muuttaa Tilastokeskuksen luokituksiin perustuen muotoon [maaseutumainen kunta Kanta-Hämeessä].

Aineistosta on pystyttävä erottamaan, mitkä kohdat avovastauksista on anonymisoitu, eli tekstiin tehdyt muutokset kannattaa merkitä selkeästi ja järjestelmällisesti. Hyvä ratkaisu on esimerkiksi hakasulkeiden käyttäminen.

Tarkempia esimerkkejä siitä, miten Haanpää on käytännössä anonymisoinut erilaisia aineistoja voi käydä katsomassa seminaarin tapahtumasivulta löytyvistä esitysmateriaaleista. Vastaava kvalitatiivisten aineistojen anonymisointia käsittelevä blogikirjoitus julkaistaan Tietoarkistoblogissa myöhemmin tämän kuun aikana.

Lisätietoja
» Seminaarin sivulta löydät esitysdiat ja myöhemmin myös videot
» Aineistonhallinnan käsikirja: Tunnisteellisuus ja anonymisointi

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Tietoarkisto on FAIR

Avoimen tieteen piirissä on viimeisen vuoden aikana alettu puhua FAIR-periaatteista. Kiinnostuksen selittänee pitkälti EU:n Horisontti 2020 -ohjelma, joka painottaa tutkimusaineistojen hyvää hallintaa ja FAIR-periaatteita.

FAIR on lyhenne sanoista Findable, Accessible, Interoperable ja Re-usable. Suomeksi voitaisiin puhua tutkimusaineistojen löydettävyydestä, saavutettavuudesta, yhteentoimivuudesta ja uudelleenkäytettävyydestä – kaikki periaatteita, joita Tietoarkisto on edistänyt jo kohta kaksikymmentä vuotta ja vanhimmat yhteiskuntatieteelliset sisararkistomme (kuten brittien UKDS) jo puoli vuosisataa.

Vaikka kyse ei olekaan meille uudesta asiasta, FAIR-keskustelu on tarjonnut oivan herätteen tarkastella Tietoarkiston toimintaa hieman erilaisesta näkökulmasta. Yksi sysäys tarkastelullemme oli myös marraskuussa OpenAIRE2020-hankkeen järjestämä työpaja. Siellä FAIR-periaatteista keskusteltiin erilaisia tutkimuksen tukipalveluja vertailukohtana käyttäen. Tietoarkisto oli yksi mukana olleista palveluista.

Koska tarjoamme aineistojen arkistointi- ja avaamispalvelujen lisäksi neuvontaa ja ohjausta tutkimusdatan hallintaan (ks. tieteenala-asiantuntijamme Katja Fältin oiva katsaus olemassa oleviin aineistonhallinnan resursseihin ja palveluihin, onkin aiheellista ja reilua kysyä: Kuinka FAIR Tietoarkisto on?

Vastaukseni on, että Tietoarkisto on erittäin FAIR. Tässä tiivistetyt perustelut:

  • Tietoarkistoon arkistoidut aineistot on kuvailtu yksityiskohtaisesti. Metadata on vapaasti saatavilla ja hyödynnettävissä, vaikka datassa voi olla rajoituksia. Annamme aineistoille aina pysyvän tunnisteen. Aineistot ovat löydettävissä Tietoarkiston oman Aila-palveluportaalin kautta ja esimerkiksi myös kansallisten Finna- ja Etsin-palveluiden kautta.
  • Metadata on vapaasti saatavilla Ailan kautta sekä Tietoarkiston OAI-PMH-rajapinnasta. Rekisteröityneet käyttäjät voivat ladata dataa Ailasta. Aila hyödyntää HAKA-käyttäjätunnistusjärjestelmää.
  • Tietoarkisto käyttää aineistojen kuvailuun kansainvälistä DDI Codebook -kuvailuformaattia sekä useita kansainvälisiä sanastoja. Metadata sisältää myös viittauksia muuhun metadataan, dataan ja julkaisuihin. Data on saatavilla yhteiskuntatieteilijöiden yleisesti käyttämässä SPSS-formaatissa.
  • Aineistojen DDI Codebook -muotoinen metadata sisältää laajasti tietoa aineiston sisällöstä, tekijöistä, keruusta, muuttujista ja aineistoon viittaamisesta. Datan käyttöehdot ovat selkeät ja sisältyvät metadataan. Metadata on saatavilla CC-lisenssillä.

Tietoarkiston kannalta haasteellisin FAIR-periaate on yhteentoimivuus. FAIRin taustalla on idea koneellisesti saavutettavasta, käsiteltävästä ja tulkittavasta tiedosta. Se ei Tietoarkiston datan osalta toteudu täydellisesti, mutta mielestämme kuitenkin niin hyvin kuin on mahdollista ja tarkoituksenmukaista.

Marraskuun OpenAIRE2020-seminaarissa pohdittiinkin, mikä riittää siihen, että datan, organisaation tai palvelun voi sanoa olevan FAIR. Mitään yhtä vastausta tähän ei saatu – eikä mielestäni tarvitsekaan saada.

Esimerkiksi organisaatioiden toiminnan arviointiin on olemassa yksityiskohtaisia sertifikaatteja ja standardeja kuten OAIS, Data Seal of Approval ja ISO 16363. FAIR-periaatteet ovat sen sijaan iskevästi nimettyjä ja ilmaistuja yleisiä tavoitteita, ja ne toimivat sellaisina hyvin.

Tietoarkiston käytäntöjen FAIR-yhteensopivuus ei ollut yllätys, onhan meillä jo DSA-sertifikaatti. Aina on kuitenkin varaa parantaa, ja FAIR-periaatteet auttavat hahmottamaan, mitkä osa-alueet ovat vahvoja ja minkä osa-alueiden kehittämistä tulisi tutkiskella tarkemmin. Uskon, että FAIR-periaatteiden avulla on myös helppo herättää yleisempää keskustelua tutkimusaineistojen avaamisesta ja hallinnasta sekä niihin liittyvistä hyvistä käytännöistä.

Lisätietoa FAIR-periaatteista:
Wilkinson, Mark D. et al (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3, Article number 160018. http://dx.doi.org/10.1038/sdata.2016.18

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkisto on FAIR

Avoimen tieteen piirissä on viimeisen vuoden aikana alettu puhua FAIR-periaatteista. Kiinnostuksen selittänee pitkälti EU:n Horisontti 2020 -ohjelma, joka painottaa tutkimusaineistojen hyvää hallintaa ja FAIR-periaatteita.

FAIR on lyhenne sanoista Findable, Accessible, Interoperable ja Re-usable. Suomeksi voitaisiin puhua tutkimusaineistojen löydettävyydestä, saavutettavuudesta, yhteentoimivuudesta ja uudelleenkäytettävyydestä – kaikki periaatteita, joita Tietoarkisto on edistänyt jo kohta kaksikymmentä vuotta ja vanhimmat yhteiskuntatieteelliset sisararkistomme (kuten brittien UKDS) jo puoli vuosisataa.

Vaikka kyse ei olekaan meille uudesta asiasta, FAIR-keskustelu on tarjonnut oivan herätteen tarkastella Tietoarkiston toimintaa hieman erilaisesta näkökulmasta. Yksi sysäys tarkastelullemme oli myös marraskuussa OpenAIRE2020-hankkeen järjestämä työpaja. Siellä FAIR-periaatteista keskusteltiin erilaisia tutkimuksen tukipalveluja vertailukohtana käyttäen. Tietoarkisto oli yksi mukana olleista palveluista.

Koska tarjoamme aineistojen arkistointi- ja avaamispalvelujen lisäksi neuvontaa ja ohjausta tutkimusdatan hallintaan (ks. tieteenala-asiantuntijamme Katja Fältin oiva katsaus olemassa oleviin aineistonhallinnan resursseihin ja palveluihin, onkin aiheellista ja reilua kysyä: Kuinka FAIR Tietoarkisto on?

Vastaukseni on, että Tietoarkisto on erittäin FAIR. Tässä tiivistetyt perustelut:

  • Tietoarkistoon arkistoidut aineistot on kuvailtu yksityiskohtaisesti. Metadata on vapaasti saatavilla ja hyödynnettävissä, vaikka datassa voi olla rajoituksia. Annamme aineistoille aina pysyvän tunnisteen. Aineistot ovat löydettävissä Tietoarkiston oman Aila-palveluportaalin kautta ja esimerkiksi myös kansallisten Finna- ja Etsin-palveluiden kautta.
  • Metadata on vapaasti saatavilla Ailan kautta sekä Tietoarkiston OAI-PMH-rajapinnasta. Rekisteröityneet käyttäjät voivat ladata dataa Ailasta. Aila hyödyntää HAKA-käyttäjätunnistusjärjestelmää.
  • Tietoarkisto käyttää aineistojen kuvailuun kansainvälistä DDI Codebook -kuvailuformaattia sekä useita kansainvälisiä sanastoja. Metadata sisältää myös viittauksia muuhun metadataan, dataan ja julkaisuihin. Data on saatavilla yhteiskuntatieteilijöiden yleisesti käyttämässä SPSS-formaatissa.
  • Aineistojen DDI Codebook -muotoinen metadata sisältää laajasti tietoa aineiston sisällöstä, tekijöistä, keruusta, muuttujista ja aineistoon viittaamisesta. Datan käyttöehdot ovat selkeät ja sisältyvät metadataan. Metadata on saatavilla CC-lisenssillä.

Tietoarkiston kannalta haasteellisin FAIR-periaate on yhteentoimivuus. FAIRin taustalla on idea koneellisesti saavutettavasta, käsiteltävästä ja tulkittavasta tiedosta. Se ei Tietoarkiston datan osalta toteudu täydellisesti, mutta mielestämme kuitenkin niin hyvin kuin on mahdollista ja tarkoituksenmukaista.

Marraskuun OpenAIRE2020-seminaarissa pohdittiinkin, mikä riittää siihen, että datan, organisaation tai palvelun voi sanoa olevan FAIR. Mitään yhtä vastausta tähän ei saatu – eikä mielestäni tarvitsekaan saada.

Esimerkiksi organisaatioiden toiminnan arviointiin on olemassa yksityiskohtaisia sertifikaatteja ja standardeja kuten OAIS, Data Seal of Approval ja ISO 16363. FAIR-periaatteet ovat sen sijaan iskevästi nimettyjä ja ilmaistuja yleisiä tavoitteita, ja ne toimivat sellaisina hyvin.

Tietoarkiston käytäntöjen FAIR-yhteensopivuus ei ollut yllätys, onhan meillä jo DSA-sertifikaatti. Aina on kuitenkin varaa parantaa, ja FAIR-periaatteet auttavat hahmottamaan, mitkä osa-alueet ovat vahvoja ja minkä osa-alueiden kehittämistä tulisi tutkiskella tarkemmin. Uskon, että FAIR-periaatteiden avulla on myös helppo herättää yleisempää keskustelua tutkimusaineistojen avaamisesta ja hallinnasta sekä niihin liittyvistä hyvistä käytännöistä.

Lisätietoa FAIR-periaatteista:
Wilkinson, Mark D. et al (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3, Article number 160018. http://dx.doi.org/10.1038/sdata.2016.18

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Teema tiedossa, mutta aineisto hakusessa (ja mieli maassa)?

Tietoarkisto on uudistanut aineistovarantoaan esitteleviä teemasivuja. Aineistoja teemoittain -sivuilta löytyy nyt päivitetty kattaus hyvinvointia ja ihmissuhteita, kuntia, köyhyyttä, lapsia, lapsuutta ja perhettä, liikuntaa ja urheilua, maahanmuuttoa, ulkomaalaisia ja rasismia, median tutkimusta, nuorisotutkimusta, terveyttä, työelämän tutkimusta, uskontoa, uskonnollisuutta ja kirkkoja, vaaleja, vanhuutta ja vanhenemista sekä ympäristöä ja energiaa luotaavia aineistovinkkejä. Ja lisää on luvassa. Aivan uusiksi teemakokonaisuuksiksi ovat lähiaikoina tulossa ainakin seksuaalisuus sekä alkoholi ja muut päihteet.

(Älä huoli. Asioilla on taipumus järjestyä. Etsi, pyydä ja ota vastaan apua!) Tietoarkisto neuvoo ja auttaa muun muassa tutkimusaineistojen haussa ja käytössä. Pääpaino on Tietoarkiston kotimaisissa tutkimusaineistoissa, mutta ohjaamme myös ulkomaisten aineistojen lähteille.

Ensimmäiset teemasivumme syntyivät aikoinaan vastauksena asiakkaidemme toiveisiin, tietopalveluna. Meitä pyydettiin seminaareihin ja opintojaksoille esittelemään tutkimusaineistojamme esimerkiksi nuorisotutkimuksen ja työelämän tutkimuksen saroilta. Sinäkin voit vinkata uusia teemasivu-aihioita! Ota yhteyttä asiakaspalveluumme.

Aineistoja teemoittain -sivut auttavat opiskelijoita, opettajia ja tutkijoita löytämään nopeammin ja helpommin eri aihe-alueisiin liittyviä tutkimusaineistoja. Uusimmat aineistot poimitaan teemasivuille automaattisesti aineistovarannostamme asiasanojen perusteella. Tietoarkistoon tallennettavien tutkimusaineistojen sisältö kuvaillaan kattavasti muun muassa lukuisilla laajasti käytetyillä sanastoilla ja luokituksilla. Suomenkielisten aineistojemme asiasanoituksessa käytämme Yleistä suomalaista asiasanastoa. Tietoarkistolaiset nostavat teemasivuilla uusien aineistojen ohella esiin myös aihe-aluetta kartoittavia aineistosarjoja ja yksittäisiä, tutustumisen arvoisia aineistoja. Tutustu siis niihin!

Teemasivut ovat yksi portti laajaan aineistovarantoomme. Avaa portti ja astu sisään.

Linkkejä ja lisätietoa:
» Aineistoja teemoittain
» Tietoarkiston tietopalvelu
» Yleinen suomalainen asiasanasto
» Yhteystiedot

Hannele Keckman-Koivuniemi
Tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

Teema tiedossa, mutta aineisto hakusessa (ja mieli maassa)?

Tietoarkisto on uudistanut aineistovarantoaan esitteleviä teemasivuja. Aineistoja teemoittain -sivuilta löytyy nyt päivitetty kattaus hyvinvointia ja ihmissuhteita, kuntia, köyhyyttä, lapsia, lapsuutta ja perhettä, liikuntaa ja urheilua, maahanmuuttoa, ulkomaalaisia ja rasismia, median tutkimusta, nuorisotutkimusta, terveyttä, työelämän tutkimusta, uskontoa, uskonnollisuutta ja kirkkoja, vaaleja, vanhuutta ja vanhenemista sekä ympäristöä ja energiaa luotaavia aineistovinkkejä. Ja lisää on luvassa. Aivan uusiksi teemakokonaisuuksiksi ovat lähiaikoina tulossa ainakin seksuaalisuus sekä alkoholi ja muut päihteet.

(Älä huoli. Asioilla on taipumus järjestyä. Etsi, pyydä ja ota vastaan apua!) Tietoarkisto neuvoo ja auttaa muun muassa tutkimusaineistojen haussa ja käytössä. Pääpaino on Tietoarkiston kotimaisissa tutkimusaineistoissa, mutta ohjaamme myös ulkomaisten aineistojen lähteille.

Ensimmäiset teemasivumme syntyivät aikoinaan vastauksena asiakkaidemme toiveisiin, tietopalveluna. Meitä pyydettiin seminaareihin ja opintojaksoille esittelemään tutkimusaineistojamme esimerkiksi nuorisotutkimuksen ja työelämän tutkimuksen saroilta. Sinäkin voit vinkata uusia teemasivu-aihioita! Ota yhteyttä asiakaspalveluumme.

Aineistoja teemoittain -sivut auttavat opiskelijoita, opettajia ja tutkijoita löytämään nopeammin ja helpommin eri aihe-alueisiin liittyviä tutkimusaineistoja. Uusimmat aineistot poimitaan teemasivuille automaattisesti aineistovarannostamme asiasanojen perusteella. Tietoarkistoon tallennettavien tutkimusaineistojen sisältö kuvaillaan kattavasti muun muassa lukuisilla laajasti käytetyillä sanastoilla ja luokituksilla. Suomenkielisten aineistojemme asiasanoituksessa käytämme Yleistä suomalaista asiasanastoa. Tietoarkistolaiset nostavat teemasivuilla uusien aineistojen ohella esiin myös aihe-aluetta kartoittavia aineistosarjoja ja yksittäisiä, tutustumisen arvoisia aineistoja. Tutustu siis niihin!

Teemasivut ovat yksi portti laajaan aineistovarantoomme. Avaa portti ja astu sisään.

Linkkejä ja lisätietoa:
» Aineistoja teemoittain
» Tietoarkiston tietopalvelu
» Yleinen suomalainen asiasanasto
» Yhteystiedot

Hannele Keckman-Koivuniemi
Tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

Tervehdys

Kuten Sami Borgin joulukuisesta bloggauksesta voitte päätellä, Tietoarkiston johtaja vaihtui vuoden alussa. Tammikuun kokouksessaan Tampereen yliopiston hallitus päätti nimittää tehtävään minut. Koska olen hoitanut tehtävää määräaikaisesti useampaan otteeseen, en voi tässä kirjoittaa ”uuden” johtajan tervehdystä. Olkoon siis pelkkä tervehdys.

Kun tehtävä on minulle ennestään tuttu, luulen tietäväni, mihin olen ryhtynyt, tehtävän hyvät ja huonotkin puolet. Olen työskennellyt Tietoarkistossa eri tehtävissä jo yhteensä 15 vuotta. Tietoarkisto on kuin toinen kotini ja toinen perheeni. Tänä aikana monet asiat Tietoarkiston toimintaympäristössä ovat muuttuneet, eikä muutoksen vauhti näytä olevan hiipumassa tulevaisuudessakaan. Avoin tiede on täällä ja putkahtelee esiin aina uusissa yhteyksissä.

Avoimen tieteen eteneminen erityisesti tällä vuosikymmenellä on ollut mieluisaa seurattavaa. Vielä mieluisampaa on se, että Tietoarkiston asiantuntijoiden osaaminen tunnetaan ja olemme haluttu yhteistyökumppani kotimaassa ja myös kansainvälisissä hankkeissa, joissa avoimen tieteen palveluita rakennetaan. Yhteistyöstä saatavat hyödyt ovat molemminpuolisia. Jaamme osaamistamme, mutta opimme myös uutta sekä organisaationa että yksittäisinä työntekijöinä. Saamme ideoita ja aineksia Tietoarkiston palvelujen kehittämiseen.

Suuri muutos samaan aikaan avoimen tieteen kehityksen kanssa on ollut rahoitusmahdollisuuksien monipuolistuminen. Olemme voineet uudistaa palveluitamme, laajentaa asiakaskuntaamme ja osallistua kansalliseen ja kansainväliseen yhteistyöhön.

Tietoarkiston johtajana ensimmäisiä toimiani on saattaa loppuun viime vuoden puolella aloitettu Tietoarkiston strategian laatiminen. Kaikki ei mene uusiksi, mutta avoimen tieteen pioneeri ei myöskään voi vain tyytyväisenä hiihdellä samaa latu-uraa horisonttiin. Viime vuonna pidetyissä työpajoissa Tietoarkiston henkilöstö ja valtakunnallinen neuvottelukunta saivat arvioida päättyneen kauden strategiaa ja esittää näkemyksiään siitä, mihin 2017–2020 pitäisi pyrkiä.

Kummassakin strategiatyöpajassa vaadittiin, eri sanoin, Tietoarkiston kansallisen roolin ja aseman selkiyttämistä avoimen tutkimusdatan pitkäaikaissaatavuuteen erikoistuneena ja palvelevana asiantuntijaorganisaationa. Tähän tietenkin pyrimme joka tapauksessa. Ajankohtainen haaste on Euroopan unionin tietosuoja-asetus ja sen vaikutukset kansalliseen lainsäädäntöön. Se tarjoaa myös mahdollisuuden Tietoarkiston roolin kirkastamiseen. Tietoarkiston on korostettava tutkimusaineistojen vastuullisen avaamisen periaatteita väistämättä. Palaamme blogissa näihin kysymyksiin vielä varmasti useaan otteeseen.

Tietosuojaa tutkimusdatan näkökulmasta käsittelemme huhtikuussa järjestettävässä Tietoarkiston ja Avoin tiede ja tutkimus -hankkeen yhteistyössä järjestämässä seminaarissa Tutkimusaineistojen anonymisointi. Nähdään Tampereella 5. huhtikuuta!

Helena Laaksonen
johtaja
etunimi.sukunimi [at] uta.fi

Tervehdys

Kuten Sami Borgin joulukuisesta bloggauksesta voitte päätellä, Tietoarkiston johtaja vaihtui vuoden alussa. Tammikuun kokouksessaan Tampereen yliopiston hallitus päätti nimittää tehtävään minut. Koska olen hoitanut tehtävää määräaikaisesti useampaan otteeseen, en voi tässä kirjoittaa ”uuden” johtajan tervehdystä. Olkoon siis pelkkä tervehdys.

Kun tehtävä on minulle ennestään tuttu, luulen tietäväni, mihin olen ryhtynyt, tehtävän hyvät ja huonotkin puolet. Olen työskennellyt Tietoarkistossa eri tehtävissä jo yhteensä 15 vuotta. Tietoarkisto on kuin toinen kotini ja toinen perheeni. Tänä aikana monet asiat Tietoarkiston toimintaympäristössä ovat muuttuneet, eikä muutoksen vauhti näytä olevan hiipumassa tulevaisuudessakaan. Avoin tiede on täällä ja putkahtelee esiin aina uusissa yhteyksissä.

Avoimen tieteen eteneminen erityisesti tällä vuosikymmenellä on ollut mieluisaa seurattavaa. Vielä mieluisampaa on se, että Tietoarkiston asiantuntijoiden osaaminen tunnetaan ja olemme haluttu yhteistyökumppani kotimaassa ja myös kansainvälisissä hankkeissa, joissa avoimen tieteen palveluita rakennetaan. Yhteistyöstä saatavat hyödyt ovat molemminpuolisia. Jaamme osaamistamme, mutta opimme myös uutta sekä organisaationa että yksittäisinä työntekijöinä. Saamme ideoita ja aineksia Tietoarkiston palvelujen kehittämiseen.

Suuri muutos samaan aikaan avoimen tieteen kehityksen kanssa on ollut rahoitusmahdollisuuksien monipuolistuminen. Olemme voineet uudistaa palveluitamme, laajentaa asiakaskuntaamme ja osallistua kansalliseen ja kansainväliseen yhteistyöhön.

Tietoarkiston johtajana ensimmäisiä toimiani on saattaa loppuun viime vuoden puolella aloitettu Tietoarkiston strategian laatiminen. Kaikki ei mene uusiksi, mutta avoimen tieteen pioneeri ei myöskään voi vain tyytyväisenä hiihdellä samaa latu-uraa horisonttiin. Viime vuonna pidetyissä työpajoissa Tietoarkiston henkilöstö ja valtakunnallinen neuvottelukunta saivat arvioida päättyneen kauden strategiaa ja esittää näkemyksiään siitä, mihin 2017–2020 pitäisi pyrkiä.

Kummassakin strategiatyöpajassa vaadittiin, eri sanoin, Tietoarkiston kansallisen roolin ja aseman selkiyttämistä avoimen tutkimusdatan pitkäaikaissaatavuuteen erikoistuneena ja palvelevana asiantuntijaorganisaationa. Tähän tietenkin pyrimme joka tapauksessa. Ajankohtainen haaste on Euroopan unionin tietosuoja-asetus ja sen vaikutukset kansalliseen lainsäädäntöön. Se tarjoaa myös mahdollisuuden Tietoarkiston roolin kirkastamiseen. Tietoarkiston on korostettava tutkimusaineistojen vastuullisen avaamisen periaatteita väistämättä. Palaamme blogissa näihin kysymyksiin vielä varmasti useaan otteeseen.

Tietosuojaa tutkimusdatan näkökulmasta käsittelemme huhtikuussa järjestettävässä Tietoarkiston ja Avoin tiede ja tutkimus -hankkeen yhteistyössä järjestämässä seminaarissa Tutkimusaineistojen anonymisointi. Nähdään Tampereella 5. huhtikuuta!

Helena Laaksonen
johtaja
etunimi.sukunimi [at] uta.fi

Mistä apua aineistonhallintaan?

Rahoittajien kiinnostus tutkimusaineistoihin ja niiden avaamiseen on tehnyt aineistonhallinnasta ajankohtaisempaa kuin koskaan. Yhä useampi suomalainen ja ulkomainen rahoittaja haluaa hakemuksen yhteyteen aineistonhallintasuunnitelman, jossa rahoituksen hakijan on määriteltävä millaista aineistoa on tarkoitus kerätä, miten sitä on tarkoitus käsitellä ja analysoida, miten tutkimuseettisiin seikkoihin, tekijänoikeuteen ja immateriaalioikeuksiin liittyvät näkökulmat huomioidaan, ja miten aineistoa on tarkoitus säilyttää tutkimuksen aikana ja sen jälkeen. Lisäksi suunnitelmissa pitää tyypillisesti määritellä, miten aineisto aiotaan saattaa avoimeksi muun tiedeyhteisön käyttöön. Jos tutkija ei aio avata aineistoaan, myös tämä ratkaisu on perusteltava.

Varsinkin tutkimusprosessin alussa villinä vellovan aineiston hallinta voi tuntua kurittoman kissalauman paimentamiselta. Paniikkiin ei kuitenkaan ole syytä, sillä tutkimusaineiston hallintaan löytyy näppärästi verkosta apuvälineitä käsikirjamaisista oppaista kursseihin.

Ensimmäisenä on luonnollisesti mainostettava Tietoarkiston omaa Aineistonhallinnan käsikirjaa. Käsikirja on informatiivinen tietopaketti, joka on jaoteltu osa-alueittain muun muassa aineistonhallinnan suunnitteluun, laadullisen ja määrällisen aineiston käsittelyyn ja kuvailuun sekä aineistojen säilyttämiseen. Ohjeistus on käytännönläheistä ja yksityiskohtaista, ja sitä on höystetty esimerkein sekä mallipohjin. Osiot voi lukea järjestyksessä tai yksitellen osa-alue kerrallaan. Jokaisen osion loppuun on koottu myös linkkilista, josta löytyy lisälukemista enemmän tietoa kaipaaville.

Kurssimaista tarjontaa etsiville on verkossa tarjolla useampiakin vaihtoehtoja. Ensisijaisesti opiskelijoille ja tutkijoille on suunnattu esimerkiksi Edinburghin yliopiston yhteydessä toimivan Edinan aineistonhallintakoulutus MANTRA, joka opastaa aineistonhallinnan saloihin interaktiivisten osioiden kautta. MANTRAssa aineistonhallintapaketti rakentuu tekstiosioista, videoista ja niihin liittyvistä tehtävistä, ja sisältöjä on mahdollista myös ladata omalle koneelle. Aivan kuten Aineistonhallinnan käsikirjassakin, voi MANTRAssa suunnistaa haluamansa osio kerrallaan, sillä kurssi ei pakota lineaariseen etenemiseen. Aineistonhallinnan opastuksen lisäksi aineiston käsittelyyn on tarjolla tutoriaaleja, joista saa käytännön vinkkejä sekä määrällisen että laadullisen, mutta myös geospatiaalisen aineiston käsittelyyn.

Courseran laaja-alaisessa kurssivalikoimassa on tutkimusaineistojen hallintaan ja jakamiseen opastava viisiviikkoinen Research Data Management and Sharing -kurssi, jonka tavoitteissa on varustaa osallistujat paremmilla aineistonhallinnan taidoilla sekä rohkaista aineistojen arkistointiin ja jakamiseen. Kurssi on koostettu viikkojen mukaan viiteen kokonaisuuteen, ja viikoittaiset opetusmateriaalit koostuvat muun muassa erilaisista harjoitustehtävistä, kokeista, lukupaketeista ja opetusvideoista. Asiakokonaisuudet painottavat aineistonhallinnan suunnittelua sekä aineiston käsittelyä, jakamista ja arkistointia. Kurssille on mahdollista osallistua ilmaiseksi; vain diplominhimoisilta peritään osallistumismaksu.

Hollantilainen Research Data Netherlands tarjoaa Essentials 4 Data Support kurssin, joka on suunniteltu ensisijaisesti aineistonhallinnan ammattilaisille eli henkilöille, joiden tehtävä on opastaa tutkijoita aineistoihin liittyvissä kysymyksissä. Kurssi opastaa aineistonhallinnan saloihin kolmella eri tavalla: netin kurssimateriaalia voi hyödyntää rekisteröitymättä palvelun käyttäjäksi, luomalla käyttäjäprofiilin tai osallistumalla online-osuuksien lisäksi läsnäoloa vaativiin osuuksiin. Viimeksi mainittu vaihtoehto on maksullinen, mutta netissä tapahtuvat osuudet ovat ilmaisia. Kurssi sopii kuitenkin hyvin myös tutkijoille, sillä se lähestyy aihetta aineiston elinkaarijaottelun avulla, jonka mukaisesti kokonaisuudet esitetään tutkimusvaiheittain.

Myös eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri CESSDA on kehittämässä omaa aineistonhallinnan moduuliaan. Tässä työssä on mukana myös Tietoarkisto. CESSDAn kehittelemä aineistonhallinnan kokonaisuus on vielä ideointivaiheessa, mutta sen tavoitteena on opastaa jo olemassa olevien aineistojen jatkokäytössä sekä tutkimusaineistojen hallinnassa, arkistoinnissa, säilyttämisessä ja jakamisessa parhaiden käytäntöjen mukaisesti. Pyrkimyksenä on noudattaa Euroopan komission Horizon 2020 -ohjelman Open Research Data -linjauksia, joissa painottuu FAIR-periaate. Sen mukaisesti Horizon 2020 -rahoituksen saajien tulee saattaa tutkimusaineistonsa löydettäväksi (findable), saavutettavaksi (accessible), yhteentoimivaksi (interoperable) ja uudelleen käytettäväksi (reusable). Ohjelman tavoite onkin, että tutkijat avaisivat tutkimusaineistonsa vuodesta 2017 eteenpäin oletusarvoisesti.

Aineistonhallinnan edessä ei siis tarvitse nosta käsiään pystyyn saati väännellä niitä epätoivoissaan. Pelkästään netistä löytyvän tarjonnan avulla on mahdollista saada kattava ohjeistus onnistuneeseen aineistonhallintaan. Ja toki Tietoarkiston asiakaspalvelu on aina valmiina auttamaan aineistonhallintaan liittyvissä kysymyksissä.

Linkkejä ja lisätietoa:
» Aineistonhallinnan käsikirja
» Edina: MANTRA
» RDNL: Essentials 4 Data Support
» Coursera MOOC: Research Data Management and Sharing
» DCC (2013): Checklist for a Data Management Plan (pdf)
» Horizon 2020:n Open Research Data (pdf)

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Mistä apua aineistonhallintaan?

Rahoittajien kiinnostus tutkimusaineistoihin ja niiden avaamiseen on tehnyt aineistonhallinnasta ajankohtaisempaa kuin koskaan. Yhä useampi suomalainen ja ulkomainen rahoittaja haluaa hakemuksen yhteyteen aineistonhallintasuunnitelman, jossa rahoituksen hakijan on määriteltävä millaista aineistoa on tarkoitus kerätä, miten sitä on tarkoitus käsitellä ja analysoida, miten tutkimuseettisiin seikkoihin, tekijänoikeuteen ja immateriaalioikeuksiin liittyvät näkökulmat huomioidaan, ja miten aineistoa on tarkoitus säilyttää tutkimuksen aikana ja sen jälkeen. Lisäksi suunnitelmissa pitää tyypillisesti määritellä, miten aineisto aiotaan saattaa avoimeksi muun tiedeyhteisön käyttöön. Jos tutkija ei aio avata aineistoaan, myös tämä ratkaisu on perusteltava.

Varsinkin tutkimusprosessin alussa villinä vellovan aineiston hallinta voi tuntua kurittoman kissalauman paimentamiselta. Paniikkiin ei kuitenkaan ole syytä, sillä tutkimusaineiston hallintaan löytyy näppärästi verkosta apuvälineitä käsikirjamaisista oppaista kursseihin.

Ensimmäisenä on luonnollisesti mainostettava Tietoarkiston omaa Aineistonhallinnan käsikirjaa. Käsikirja on informatiivinen tietopaketti, joka on jaoteltu osa-alueittain muun muassa aineistonhallinnan suunnitteluun, laadullisen ja määrällisen aineiston käsittelyyn ja kuvailuun sekä aineistojen säilyttämiseen. Ohjeistus on käytännönläheistä ja yksityiskohtaista, ja sitä on höystetty esimerkein sekä mallipohjin. Osiot voi lukea järjestyksessä tai yksitellen osa-alue kerrallaan. Jokaisen osion loppuun on koottu myös linkkilista, josta löytyy lisälukemista enemmän tietoa kaipaaville.

Kurssimaista tarjontaa etsiville on verkossa tarjolla useampiakin vaihtoehtoja. Ensisijaisesti opiskelijoille ja tutkijoille on suunnattu esimerkiksi Edinburghin yliopiston yhteydessä toimivan Edinan aineistonhallintakoulutus MANTRA, joka opastaa aineistonhallinnan saloihin interaktiivisten osioiden kautta. MANTRAssa aineistonhallintapaketti rakentuu tekstiosioista, videoista ja niihin liittyvistä tehtävistä, ja sisältöjä on mahdollista myös ladata omalle koneelle. Aivan kuten Aineistonhallinnan käsikirjassakin, voi MANTRAssa suunnistaa haluamansa osio kerrallaan, sillä kurssi ei pakota lineaariseen etenemiseen. Aineistonhallinnan opastuksen lisäksi aineiston käsittelyyn on tarjolla tutoriaaleja, joista saa käytännön vinkkejä sekä määrällisen että laadullisen, mutta myös geospatiaalisen aineiston käsittelyyn.

Courseran laaja-alaisessa kurssivalikoimassa on tutkimusaineistojen hallintaan ja jakamiseen opastava viisiviikkoinen Research Data Management and Sharing -kurssi, jonka tavoitteissa on varustaa osallistujat paremmilla aineistonhallinnan taidoilla sekä rohkaista aineistojen arkistointiin ja jakamiseen. Kurssi on koostettu viikkojen mukaan viiteen kokonaisuuteen, ja viikoittaiset opetusmateriaalit koostuvat muun muassa erilaisista harjoitustehtävistä, kokeista, lukupaketeista ja opetusvideoista. Asiakokonaisuudet painottavat aineistonhallinnan suunnittelua sekä aineiston käsittelyä, jakamista ja arkistointia. Kurssille on mahdollista osallistua ilmaiseksi; vain diplominhimoisilta peritään osallistumismaksu.

Hollantilainen Research Data Netherlands tarjoaa Essentials 4 Data Support kurssin, joka on suunniteltu ensisijaisesti aineistonhallinnan ammattilaisille eli henkilöille, joiden tehtävä on opastaa tutkijoita aineistoihin liittyvissä kysymyksissä. Kurssi opastaa aineistonhallinnan saloihin kolmella eri tavalla: netin kurssimateriaalia voi hyödyntää rekisteröitymättä palvelun käyttäjäksi, luomalla käyttäjäprofiilin tai osallistumalla online-osuuksien lisäksi läsnäoloa vaativiin osuuksiin. Viimeksi mainittu vaihtoehto on maksullinen, mutta netissä tapahtuvat osuudet ovat ilmaisia. Kurssi sopii kuitenkin hyvin myös tutkijoille, sillä se lähestyy aihetta aineiston elinkaarijaottelun avulla, jonka mukaisesti kokonaisuudet esitetään tutkimusvaiheittain.

Myös eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri CESSDA on kehittämässä omaa aineistonhallinnan moduuliaan. Tässä työssä on mukana myös Tietoarkisto. CESSDAn kehittelemä aineistonhallinnan kokonaisuus on vielä ideointivaiheessa, mutta sen tavoitteena on opastaa jo olemassa olevien aineistojen jatkokäytössä sekä tutkimusaineistojen hallinnassa, arkistoinnissa, säilyttämisessä ja jakamisessa parhaiden käytäntöjen mukaisesti. Pyrkimyksenä on noudattaa Euroopan komission Horizon 2020 -ohjelman Open Research Data -linjauksia, joissa painottuu FAIR-periaate. Sen mukaisesti Horizon 2020 -rahoituksen saajien tulee saattaa tutkimusaineistonsa löydettäväksi (findable), saavutettavaksi (accessible), yhteentoimivaksi (interoperable) ja uudelleen käytettäväksi (reusable). Ohjelman tavoite onkin, että tutkijat avaisivat tutkimusaineistonsa vuodesta 2017 eteenpäin oletusarvoisesti.

Aineistonhallinnan edessä ei siis tarvitse nosta käsiään pystyyn saati väännellä niitä epätoivoissaan. Pelkästään netistä löytyvän tarjonnan avulla on mahdollista saada kattava ohjeistus onnistuneeseen aineistonhallintaan. Ja toki Tietoarkiston asiakaspalvelu on aina valmiina auttamaan aineistonhallintaan liittyvissä kysymyksissä.

Linkkejä ja lisätietoa:
» Aineistonhallinnan käsikirja
» Edina: MANTRA
» RDNL: Essentials 4 Data Support
» Coursera MOOC: Research Data Management and Sharing
» DCC (2013): Checklist for a Data Management Plan (pdf)
» Horizon 2020:n Open Research Data (pdf)

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Suomi on tieteen avoimuudessa Pohjoismaiden kärkimaa

Tieteen avoimuus on tärkeä tavoite, kysyttiin asiaa sitten suomalaisilta, muilta pohjoismaalaisilta tai eurooppalaisilta. Useimmissa maissa on kuitenkin vielä melkoisesti matkaa siihen, että avoimuus olisi sujuva osa tutkijoiden arkea.

Hyvät ja huonot uutiset kävivät selväksi Helsingissä viime viikolla järjestetyssä Nordic Open Science and Research Forum 2016 -tapahtumassa, johon kokoontui avoimen tieteen asiantuntijoita ainakin Suomesta, Ruotsista, Norjasta, Tanskasta ja Brysselistä.

Kansainväliset puhujat olivat yksimielisiä avoimen tieteen eduista. Esityksestä toiseen todettiin, että ihannetapauksessa avoin tiede nopeuttaa innovaatioiden syntymistä ja takaa sen, että sekä yhteiskunta että yksityiset rahoittajat saavat tutkimukseen sijoittamillensa rahoille parhaan mahdollisen vastineen. Tutkijoihin kohdistuvista hyödyistä korostuivat ainakin päällekkäisen työn väheneminen ja tutkimusten yhteiskunnallisen vaikuttavuuden kasvu.

Esimerkiksi Jean-Claude Burgelman Euroopan Komission tutkimus- ja innovaatio-osastolta totesi, että avoimen tieteen edistämisen keskeisenä tavoitteena on kasvattaa radikaalisti eurooppalaisen tieteen laatua ja vaikuttavuutta – kukapa tällaisia tavoitteita vastustaisi.

Kaikesta huolimatta siirtyminen avoimen tieteen aikakaudelle on monissa maissa lähtenyt liikkeelle hitaasti. Pohjoismaista kehityksessä on selvästi pisimmällä Suomi. Meillä tieteen avaamiseen on ryhdytty päättäväisesti sekä poliittisen hallinnon, rahoittajien että yliopistojen tasolla.

Opetusministeriön Avoin tiede ja tutkimus -hankkeen tavoitteena on nostaa Suomi avoimen tieteen kärkimaaksi vuoden 2017 loppuun mennessä. Suomen Akatemia vaatii rahoitushakemuksiinsa liitteeksi aineistonhallintasuunnitelmaa, joka sisältää suunnitelman datan avaamisesta, ja yliopisto toisensa perään on laatinut viimeisen vuoden aikana itselleen datapolitiikan.

Esimerkiksi Etelä-Tanskan yliopiston professori Henrik Pedersen totesikin, että heillä avoimen tieteen asioissa on otettu esimerkkiä juuri Suomesta. Kehuja suomalaisten rahoittajien, poliitikkojen ja yliopistojen aktiivisuudesta tuli myös norjalaisilta ja ruotsalaisilta avoimen tieteen kollegoilta.

Suurin syy avoimen tieteen hitaaseen vallankumouksen on todennäköisesti projektin massiivinen luonne. Jean-Claude Burgelman huomautti, että avoin tiede merkitsee systemaattista toimintatavan muutosta koko tiede- ja tutkimusmaailmassa. Tutkimusaineistojen ja -tulosten onnistunut avaaminen vaatii konkreettisia muutoksia tutkimusprosessin kaikissa vaiheissa. Osaamisen ja ajattelumallien päivittämistä tarvitaan kaikissa tutkimuksen sidosryhmissä.

Esityksistä nousi esiin monia konkreettisia huolia, joihin pitäisi löytää ratkaisu ennen kuin avoin tiede voi oikeasti muuttua hienosta visiosta käytännöksi. Erityisen yksimielisiä kansainväliset asiantuntijat olivat siitä, että tieteen avaaminen vaatii rahoitusta, tutkijoiden ja tutkimuksen tukipalveluissa työskentelevän henkilökunnan kouluttamista, selkeää palkitsemismallia ja infrastruktuureja, jotka käytännössä tekevät tieteen avaamisesta mahdollista – avoimille aineistoille täytyy esimerkiksi olla tarjolla säilytyspaikkoja, joista toiset tutkijat pääsevät niitä helposti hyödyntämään.

Päättäjät ja poliitikot tuntuvat olevan sekä Pohjoismaissa että muualla Euroopassa tieteen avaamisesta pääosin innoissaan, mutta tutkijoilla on vielä selvästi varautuneempi asenne. Esimerkiksi Ruotsin tietoarkiston johtaja Max Petzold totesikin, että käytännössä avoimuuteen siirtymisen täytyy tapahtua paikallisesti yliopistoissa, joissa tutkijat aineistojansa tuottavat. Avoimuudesta voi tulla totta vain, jos käytännön apu, aineistonhallintakoulutus ja tarvittavat IT-infrastruktuurit saadaan tutkijoiden käyttöön, heidän omiin kotiyliopistoihinsa.

Esiintyjät olivat järjestäen sitä mieltä, että ratkaisevia kysymyksiä tutkijoiden motivoimisen kannalta ovat rahoitus, joka on suunnattu nimenomaan aineistojen avaamiseen, ja lupaus siitä, että aineistojen avaamisesta saa tieteellisen meriitin.

Moni korosti myös sitä, että avoimen tieteen huumassa pitää muistaa ottaa huomioon eri tieteenalojen väliset erot ja se, että ehdoton vaatimus kaikkien aineistojen avaamisesta ei ole realistinen tai edes järkevä. Esimerkiksi Mikael Karstensen Elbæk Tanskan teknillisestä yliopistosta muistutti, että yliopistojen yhteistyö yksityisten yritysten kanssa ei saa avoimuuden takia vaarantua. Hänen mukaansa avoimen datan käsitteestä olisikin hyvä siirtyä reilun datan käsitteeseen. Tällöin lähtökohtana olisi, että data on niin avointa kuin mahdollista, mutta toisaalta myös niin yksityistä kuin on tarpeen.

Hallvard Fossheim Bergenin yliopistosta korosti, että kunnioitus tutkittavaa kohtaan ei saa avoimuuden aikakaudella unohtua. Hän muistutti, että jos tutkimuksessa käsitellään henkilötietoja, tutkittavalta täytyy olla aineiston avaamiseen aina vapaaehtoinen, asialliseen informointiin perustuva suostumus.

Suomen Akatemian tutkimusasioista vastaava ylijohtaja Riitta Maijala puolestaan huomautti, että tutkimuksen laadun ja luotettavuuden säilymisestä pitää pystyä huolehtimaan, vaikka avoimuus lisääntyy. Hän tiivisti, että tieteen avaaminen täytyy hoitaa niin, että tieteen laatu nousee eikä heikkene.

Vaikka avoimeen tieteeseen liittyy vielä monenlaisia huolia, niiden ratkaisemiseksi on alettu tehdä aktiivisesti töitä eri puolilla Eurooppaa.

Esimerkiksi Euroopan Komission asettama kansainvälinen työryhmä työskentelee parhaillaan kahdeksan keskeisen avoimeen tieteeseen liittyvän kysymyksen parissa. Listalla ovat muun muassa tutkijoiden palkitsemismalli, tieteen laadun ja vaikuttavuuden mittaustavat, tiedejulkaisemisen tulevaisuus ja eurooppalainen avoimen tieteen pilvipalvelu, joka tarjoaa yhden käytännön ratkaisun datan säilyttämiseen ja jakamiseen.

Ivo Grigorov, Tanskan teknillisestä yliopistosta esitteli EU-rahoitteista Foster-projektia, jossa tutkijoille ja esimerkiksi kirjastojen henkilökunnalle tarjotaan avoimeen tieteeseen ja aineistonhallintaan liittyvää koulutusta sekä sähköisesti että kasvotusten.

Sverker Holmgren NordForskista kertoi, että Norjassa on viimeisten kolmen vuoden aikana alettu pienen tauon jälkeen tehdä tosissaan töitä avoimen tieteen edistämisen eteen. Esimerkiksi Norwegian Research Council voi nykyään myöntää rahaa erikseen aineistojen avaamiseen. Ympäri Pohjois-Eurooppaa on parhaillaan käynnissä lukuisia lupaavia projekteja.

Jean-Claude Burgelman huomautti, että tieteen avaaminen ei ole pinnalla vain Pohjoismaissa tai Euroopassa, vaan se kiinnostaa juuri nyt ympäri maailmaa. Hän totesikin, että edessä on jännittävät poliittiset ajat, kun avointa tiedettä aletaan toden teolla muuttaa visiosta todellisuudeksi kaikkialla maailmassa.

Lisätietoja:
» Nordic open Science and Research Forum

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi