Tag Archives: tutkimusaineistot

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

IFDO tutki tutkimusrahoittajien datasuosituksia

Olen toiminut viitisen vuotta pienen kansainvälisen järjestön puheenjohtajana. International Federation of Data Organizations eli IFDO on hiljattain toteuttanut hankkeen, jossa vertailtiin eri maiden keskeisten tutkimusrahoittajien datapolitiikkoja kulttuurin ja yhteiskunnan tutkimuksen aloilla. IFDOn suunnittelemaan hankkeeseen ja Vigdis Kvalheimin ja Trond Kvammen pääosin kirjoittamaan selvitysraporttiin voi tutustua IFDOn verkkosivuilla (www.ifdo.org).

Raportin tiedot koottiin enimmäkseen vuonna 2012. Alan asiantuntijoille suunnattiin verkkokysely, johon tuli vastauksia 32 maasta. Kunkin maan asiantuntija raportoi ja arvioi tilannetta oman maansa osalta. Vastaajat eivät olleet tutkimusrahoittajien edustajia vaan tutkittujen alojen datapalveluammattilaisia ja tutkijoita. Vastaajajoukko edustaa maita, jotka ovat tavalla tai toisella aktiivisesti mukana data-arkistoalan kansainvälisessä yhteistyössä tai osallistuvat laajoihin kansainvälisiin vertailututkimuksiin. Vastaajajoukossa ovat aliedustettuina tutkimusjärjestelmiltään kehittymättömimmät maat.

Yksityiskohtaisimmat tutkimusaineistojen avointa saatavuutta tukevat politiikkasuositukset löytyvät yleensä maista, joiden tutkimusinfrastruktuurit ovat tutkituista maista kehittyneimpiä. Tällaisia ovat Pohjois-Amerikan ja useat Länsi-Euroopan maat. Näidenkin kesken on tosin suuria eroavuuksia tutkimusdatan avoimuutta koskevissa tutkimusrahoittajien avoimuusohjeissa.

Isossa-Britanniassa keskeiset tutkimusrahoittajat ovat edellyttäneet jo pitkään rahoittamiltaan tutkimusprojekteilta, että ne tarjoavat kokoamansa tutkimusdatat hankkeen päätyttyä arkistoitavaksi alan kansalliseen data-arkistoon UKDAan. Samantyyppiseen ratkaisuun ovat päätyneet epäsuoremmin kehotuksin useat pohjoisamerikkalaiset tutkimusrahoittajat.

Suomessa Suomen Akatemia suosittaa mutta ei edellytä yhteiskuntatieteellisten aineistojen arkistointia Yhteiskuntatieteelliseen tietoarkistoon. Edistyksellistä Suomessa on vaatimus aineistonhallintasuunnitelmasta osana tutkimussuunnitelmaa. IFDOn kyselyn kattamista maista vain joka neljännessä maan keskeisin kulttuurin ja yhteiskunnan tutkimuksen alan tutkimusrahoittaja edellyttää aineistonhallintasuunnitelmaa (8/32).

Tutkituista maista noin kahdessa kolmesta tutkimusrahoittajat suosittivat jollakin tavalla uusien tutkimusdatojen avaamista tiedeyhteisön käyttöön hankkeiden päättymisen jälkeen. Vaatimattomimmillaan edellytys voi täyttyä, kun tutkimusryhmä varmistaa itse minimitasoisesti aineiston avaamisen ja jatkokäyttömahdollisuudet.

Kunnolliset jatkokäyttömahdollisuudet muodostuvat todennäköisimmin datan avaamisen kansainvälisiin toimintastandardeihin sitoutuneiden palveluyksikköjen tuella. Data-arkistopalvelujen käyttöä koskevia rahoittajien suosituksia tai edellytyksiä löytyi kuitenkin vain harvemmassa kuin joka toisessa tutkitussa maassa.

Yksi huolestuttavimmista havainnoista oli datan avoimuutta tukevien toimintaohjeiden ylimalkaisuus. Useimmiten tutkimusrahoittajien politiikkaohjeet eivät olleet vahvasti joitakin toimia edellyttäviä vaan ne olivat suosituksia. Lisäksi ne ottivat ani harvoin kantaa esimerkiksi kansainvälisten kuvailustandardien hyödyntämiseen tutkimusaineiston dokumentoinnissa. Nämä ovat aineistojen tietojen löydettävyyden ja datan informoidun jatkokäytön kannalta erittäin tärkeitä seikkoja.

IFDOn selvityksen yleiset johtopäätökset korostavat tarvetta muutokseen tutkimusrahoittajien datapolitiikoissa. Monista ja varsinkin tutkimatta jääneistä maista tutkimusdatan avoimuutta tukevat rahoittajapolitiikat puuttuvat kokonaan. Yleistymisestään huolimatta datapolitiikkojen puute koskee edelleen myös monia tutkimusjärjestelmiltään kehittyneimpiä maita.

Ensimmäisiä askeleita oikeaan suuntaan ovat tutkimusdatan avaamista tukevien infrastruktuurien perustaminen ja vahvistaminen sekä tällaisten tukipalvelujen käyttöä korostavien datapolitiikkojen käyttöönotto.

Raportin toinen pääsuositus koskee politiikkasuositusten sisältöä. Yleisluonteisuuden sijasta tutkimusrahoittajien politiikkaohjeiden tulisi osoittaa nykyistä täsmällisemmin se, milloin, minne ja miten tutkimusaineistot arkistoidaan avoimeen käyttöön tutkimushankkeiden päättymisen jälkeen. Tätä tavoitetta tukisivat esimerkiksi nykyistä laajempi aineistonhallintasuunnitelmien edellyttäminen osana tutkimussuunnitelmia ja aineistonhallintasuunnitelmien tarkempi ohjeistus. Onhan hyvin suunniteltu jo puoliksi tehty.

Lisätietoja:
» Policies for Sharing Research Data in Social Sciences and Humanities (2014)
» IFDO Data Sharing Policies Fact Sheet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

IFDO tutki tutkimusrahoittajien datasuosituksia

Olen toiminut viitisen vuotta pienen kansainvälisen järjestön puheenjohtajana. International Federation of Data Organizations eli IFDO on hiljattain toteuttanut hankkeen, jossa vertailtiin eri maiden keskeisten tutkimusrahoittajien datapolitiikkoja kulttuurin ja yhteiskunnan tutkimuksen aloilla. IFDOn suunnittelemaan hankkeeseen ja Vigdis Kvalheimin ja Trond Kvammen pääosin kirjoittamaan selvitysraporttiin voi tutustua IFDOn verkkosivuilla (www.ifdo.org).

Raportin tiedot koottiin enimmäkseen vuonna 2012. Alan asiantuntijoille suunnattiin verkkokysely, johon tuli vastauksia 32 maasta. Kunkin maan asiantuntija raportoi ja arvioi tilannetta oman maansa osalta. Vastaajat eivät olleet tutkimusrahoittajien edustajia vaan tutkittujen alojen datapalveluammattilaisia ja tutkijoita. Vastaajajoukko edustaa maita, jotka ovat tavalla tai toisella aktiivisesti mukana data-arkistoalan kansainvälisessä yhteistyössä tai osallistuvat laajoihin kansainvälisiin vertailututkimuksiin. Vastaajajoukossa ovat aliedustettuina tutkimusjärjestelmiltään kehittymättömimmät maat.

Yksityiskohtaisimmat tutkimusaineistojen avointa saatavuutta tukevat politiikkasuositukset löytyvät yleensä maista, joiden tutkimusinfrastruktuurit ovat tutkituista maista kehittyneimpiä. Tällaisia ovat Pohjois-Amerikan ja useat Länsi-Euroopan maat. Näidenkin kesken on tosin suuria eroavuuksia tutkimusdatan avoimuutta koskevissa tutkimusrahoittajien avoimuusohjeissa.

Isossa-Britanniassa keskeiset tutkimusrahoittajat ovat edellyttäneet jo pitkään rahoittamiltaan tutkimusprojekteilta, että ne tarjoavat kokoamansa tutkimusdatat hankkeen päätyttyä arkistoitavaksi alan kansalliseen data-arkistoon UKDAan. Samantyyppiseen ratkaisuun ovat päätyneet epäsuoremmin kehotuksin useat pohjoisamerikkalaiset tutkimusrahoittajat.

Suomessa Suomen Akatemia suosittaa mutta ei edellytä yhteiskuntatieteellisten aineistojen arkistointia Yhteiskuntatieteelliseen tietoarkistoon. Edistyksellistä Suomessa on vaatimus aineistonhallintasuunnitelmasta osana tutkimussuunnitelmaa. IFDOn kyselyn kattamista maista vain joka neljännessä maan keskeisin kulttuurin ja yhteiskunnan tutkimuksen alan tutkimusrahoittaja edellyttää aineistonhallintasuunnitelmaa (8/32).

Tutkituista maista noin kahdessa kolmesta tutkimusrahoittajat suosittivat jollakin tavalla uusien tutkimusdatojen avaamista tiedeyhteisön käyttöön hankkeiden päättymisen jälkeen. Vaatimattomimmillaan edellytys voi täyttyä, kun tutkimusryhmä varmistaa itse minimitasoisesti aineiston avaamisen ja jatkokäyttömahdollisuudet.

Kunnolliset jatkokäyttömahdollisuudet muodostuvat todennäköisimmin datan avaamisen kansainvälisiin toimintastandardeihin sitoutuneiden palveluyksikköjen tuella. Data-arkistopalvelujen käyttöä koskevia rahoittajien suosituksia tai edellytyksiä löytyi kuitenkin vain harvemmassa kuin joka toisessa tutkitussa maassa.

Yksi huolestuttavimmista havainnoista oli datan avoimuutta tukevien toimintaohjeiden ylimalkaisuus. Useimmiten tutkimusrahoittajien politiikkaohjeet eivät olleet vahvasti joitakin toimia edellyttäviä vaan ne olivat suosituksia. Lisäksi ne ottivat ani harvoin kantaa esimerkiksi kansainvälisten kuvailustandardien hyödyntämiseen tutkimusaineiston dokumentoinnissa. Nämä ovat aineistojen tietojen löydettävyyden ja datan informoidun jatkokäytön kannalta erittäin tärkeitä seikkoja.

IFDOn selvityksen yleiset johtopäätökset korostavat tarvetta muutokseen tutkimusrahoittajien datapolitiikoissa. Monista ja varsinkin tutkimatta jääneistä maista tutkimusdatan avoimuutta tukevat rahoittajapolitiikat puuttuvat kokonaan. Yleistymisestään huolimatta datapolitiikkojen puute koskee edelleen myös monia tutkimusjärjestelmiltään kehittyneimpiä maita.

Ensimmäisiä askeleita oikeaan suuntaan ovat tutkimusdatan avaamista tukevien infrastruktuurien perustaminen ja vahvistaminen sekä tällaisten tukipalvelujen käyttöä korostavien datapolitiikkojen käyttöönotto.

Raportin toinen pääsuositus koskee politiikkasuositusten sisältöä. Yleisluonteisuuden sijasta tutkimusrahoittajien politiikkaohjeiden tulisi osoittaa nykyistä täsmällisemmin se, milloin, minne ja miten tutkimusaineistot arkistoidaan avoimeen käyttöön tutkimushankkeiden päättymisen jälkeen. Tätä tavoitetta tukisivat esimerkiksi nykyistä laajempi aineistonhallintasuunnitelmien edellyttäminen osana tutkimussuunnitelmia ja aineistonhallintasuunnitelmien tarkempi ohjeistus. Onhan hyvin suunniteltu jo puoliksi tehty.

Lisätietoja:
» Policies for Sharing Research Data in Social Sciences and Humanities (2014)
» IFDO Data Sharing Policies Fact Sheet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

ATT käynnistyi

Opetus- ja kulttuuriministeriö on käynnistänyt tiedon saatavuuden ja avoimen tieteen edistämiseksi Avoimen tieteen ja tutkimuksen hankkeen vuosille 2014–2017. Virallisena tavoitteenaan ATT-hanke ”määrittää kansallisen tahtotilan vuodelle 2017 ja edistää avointa tiedettä kolmella rintamalla: tutkimusjulkaisut, tutkimusdata ja menetelmät”.

Avausseminaari järjestettiin Helsingissä 19.3.2014. Ohjelman pääosan muodostivat kolme paneelia, joissa aiheina olivat hankkeen tavoitteiden mukaan avoimet julkaisut, avoin data ja avoimet menetelmät. Toimin puheenjohtajana tutkimusdatapaneelissa, johon osallistuivat panelisteina Pirjo-Leena Forsström CSC:stä, Laura Höijer Ympäristöhallinnosta, Tuuli Toivonen Helsingin yliopistosta sekä Jussi Simpura THL:stä. Kokoan seuraavassa paneelin antia kahdesta keskusteluteemasta.

Miksi avata tutkimusdataa? Keskustelussa nousi esiin demokratianäkökulma: avaamalla tutkimusdataa kaikki pääsevät käyttämään sitä. Datan avoimen saatavuuden koheneminen voi myös edesauttaa innovaatioita ja luovuutta, mikä edistää tutkimuksen tuottavuutta.

Vaikka datan avaaminen maksaa, se voi tuottaa uutta liiketoimintaa ja tuoda myös säästöjä muun muassa uusien aineistojen pienempinä keruukustannuksina. Suomea koskevan tutkimusdatan avaaminen kansainväliseen käyttöön saattaa myös luoda uudentyyppistä, maatamme hyödyttävää tutkimustoimintaa ulkomaille.

Tutkijoiden näkökulmasta datan avaamista pidettiin erittäin keskeisenä tavoitteena. Useat panelistit mainitsivat tarpeen tieteellisen toimintakulttuurin muutokseen siten, että tutkimusdatan julkaiseminen ymmärrettäisiin tieteellisenä meriittinä. Oman tutkimuksen aineistojen avaaminen on tutkijalle myös uskottavuuskysymys, koska datansa julkaisseen tutkijan tulokset voi aina tarkistaa.

Paneeli käsitteli myös tutkimusdatan avaamisen haasteita Suomessa. Mainittujen asioiden lista muodostui pitkäksi: miten viitata tutkimusdataan ja antaa siitä meriittiä; tekijyys- ja omistajuuskysymykset; datan lisensointi; tietosuojakysymykset ja tutkimusetiikka; julkaisujen, datan ja menetelmien yhdistäminen; tutkimustiedon hyödyntäminen yhteiskunnallisessa päätöksenteossa jne.

Avaamista tukevan toimintakulttuurimuutoksen haasteena on edelleen tutkimusdatan ymmärtäminen tutkijan (omana) pääomana. Liian usein datan jakaminen mielletään siitä luopumisena ja ehkä kilpailuedunkin menettämisenä. Juuri siksi tutkimusrahoittajien ja -organisaatioiden tulisi edellyttää ja ohjeistaa tutkimusdatan hallintaa ja sen suunnittelua riittävästi. Aineistonhallinnan suunnittelu ja toteuttaminen pitäisi saada itsestään selväksi osaksi tutkijoiden perustyönkuvaa.

Lisäksi paneeli totesi, että tietovarantojen avaamisessa on otettava huomioon riittävä jatkokäytön tuki. Monien tutkimusaineistojen järkevä jatkokäyttö vaatii vierihoitoa aineiston keränneeltä taholta. Tutkimusdatan jatkokäyttäjän ei siis pidä lähteä soitellen sotaan. Ei pidä laulaa virttä, jos ei tiedä sen numeroa.

Datapaneeli on nähtävissä kokonaisuudessaan seminaaritallenteesta, joka sisältää kaikki muutkin seminaariesitykset ja paneelit. Seminaari oli hyvä avaus ATT:lle.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

ATT käynnistyi

Opetus- ja kulttuuriministeriö on käynnistänyt tiedon saatavuuden ja avoimen tieteen edistämiseksi Avoimen tieteen ja tutkimuksen hankkeen vuosille 2014–2017. Virallisena tavoitteenaan ATT-hanke ”määrittää kansallisen tahtotilan vuodelle 2017 ja edistää avointa tiedettä kolmella rintamalla: tutkimusjulkaisut, tutkimusdata ja menetelmät”.

Avausseminaari järjestettiin Helsingissä 19.3.2014. Ohjelman pääosan muodostivat kolme paneelia, joissa aiheina olivat hankkeen tavoitteiden mukaan avoimet julkaisut, avoin data ja avoimet menetelmät. Toimin puheenjohtajana tutkimusdatapaneelissa, johon osallistuivat panelisteina Pirjo-Leena Forsström CSC:stä, Laura Höijer Ympäristöhallinnosta, Tuuli Toivonen Helsingin yliopistosta sekä Jussi Simpura THL:stä. Kokoan seuraavassa paneelin antia kahdesta keskusteluteemasta.

Miksi avata tutkimusdataa? Keskustelussa nousi esiin demokratianäkökulma: avaamalla tutkimusdataa kaikki pääsevät käyttämään sitä. Datan avoimen saatavuuden koheneminen voi myös edesauttaa innovaatioita ja luovuutta, mikä edistää tutkimuksen tuottavuutta.

Vaikka datan avaaminen maksaa, se voi tuottaa uutta liiketoimintaa ja tuoda myös säästöjä muun muassa uusien aineistojen pienempinä keruukustannuksina. Suomea koskevan tutkimusdatan avaaminen kansainväliseen käyttöön saattaa myös luoda uudentyyppistä, maatamme hyödyttävää tutkimustoimintaa ulkomaille.

Tutkijoiden näkökulmasta datan avaamista pidettiin erittäin keskeisenä tavoitteena. Useat panelistit mainitsivat tarpeen tieteellisen toimintakulttuurin muutokseen siten, että tutkimusdatan julkaiseminen ymmärrettäisiin tieteellisenä meriittinä. Oman tutkimuksen aineistojen avaaminen on tutkijalle myös uskottavuuskysymys, koska datansa julkaisseen tutkijan tulokset voi aina tarkistaa.

Paneeli käsitteli myös tutkimusdatan avaamisen haasteita Suomessa. Mainittujen asioiden lista muodostui pitkäksi: miten viitata tutkimusdataan ja antaa siitä meriittiä; tekijyys- ja omistajuuskysymykset; datan lisensointi; tietosuojakysymykset ja tutkimusetiikka; julkaisujen, datan ja menetelmien yhdistäminen; tutkimustiedon hyödyntäminen yhteiskunnallisessa päätöksenteossa jne.

Avaamista tukevan toimintakulttuurimuutoksen haasteena on edelleen tutkimusdatan ymmärtäminen tutkijan (omana) pääomana. Liian usein datan jakaminen mielletään siitä luopumisena ja ehkä kilpailuedunkin menettämisenä. Juuri siksi tutkimusrahoittajien ja -organisaatioiden tulisi edellyttää ja ohjeistaa tutkimusdatan hallintaa ja sen suunnittelua riittävästi. Aineistonhallinnan suunnittelu ja toteuttaminen pitäisi saada itsestään selväksi osaksi tutkijoiden perustyönkuvaa.

Lisäksi paneeli totesi, että tietovarantojen avaamisessa on otettava huomioon riittävä jatkokäytön tuki. Monien tutkimusaineistojen järkevä jatkokäyttö vaatii vierihoitoa aineiston keränneeltä taholta. Tutkimusdatan jatkokäyttäjän ei siis pidä lähteä soitellen sotaan. Ei pidä laulaa virttä, jos ei tiedä sen numeroa.

Datapaneeli on nähtävissä kokonaisuudessaan seminaaritallenteesta, joka sisältää kaikki muutkin seminaariesitykset ja paneelit. Seminaari oli hyvä avaus ATT:lle.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Kaksi viestiä

Yliopistojen ulkoinen tiedeviestintä tuntuu muuttuvan etupainotteiseksi elvistelyksi. Liian paljon keskitytään esittelemään aikomuksia ja saadun tutkimusrahoituksen määrää. No – mitä isot edellä, sitä pienet perässä. Tietoarkistokin sai juuri mittavan rahoituksen Suomen Akatemialta toimintojensa vahvistamiseen. Kuinka ollakaan, omakin uutisointimme muisti mainita muhkean rahasumman.

Yksikkömme kaltaiselle tuki-infrastruktuurille ei tarjoudu liian usein mahdollisuuksia kertoa toiminnastaan laajalle yleisölle. Viestintämme on enimmäkseen kansallisen ja kansainvälisen tutkimusyhteisön sisäistä. Sen pääkohteita ovat yliopistot, tutkimusorganisaatiot ja muut tutkimusaineistoja keräävät, teettävät ja käyttävät tahot. Palvelujemme pääkäyttäjäryhmiä ovat tutkijat, opettajat ja opiskelijat.

Ydinviestimme kaikille on palvelujemme maksuton käyttömahdollisuus ja niiden hyödyllisyys tutkimusaineistojen elinkaaren hallinnan ja aktiivisen, avoimen käytön kannalta. Meille voi ja kannattaa arkistoida tutkimusaineistonsa, koska sitä kautta se dokumentoidaan kansainvälisen kuvailukäytännön mukaan. Aineistolle annetaan aineistoviite, tutkimusdata julkaistaan ja siihen voidaan viitata. Julkaistu aineisto on tuottajalleen tieteellinen meriitti. Tutkimuseettisen neuvottelukunnan ja keskeisten tiederahoittajien nykysuosituksen mukaan julkaistujen tutkimusdatojen aineistoviitteet liitetään tutkimuksen harjoittajan ansioluetteloon muiden julkaisujen tavoin.

Tutkimusaineistoihin viittaamista tietoarkisto tukee kääntämällä tarvittaessa aineiston kuvailun englanniksi. Näin aineisto voidaan liittää kansainvälisiin tutkimusaineistotietokantoihin. Kvantitatiivisten tutkimusaineistojen osalta kielenkäännökset kattavat data-aineiston muuttujakuvauksineen.

Tutkimusaineistojen jatkokäyttäjille tarjoamme monipuolisia ja muitakin kuin yhteiskuntatieteitä tukevia palveluja. Aineistosivujen ohella verkkosivujemme keskeisiä sisältöjä ovat Tutkimusaineistojen tiedonhallinnan käsikirja ja Menetelmäopetuksen tietovaranto. Ne ovat laaja-alaisia oppaita tutkimusaineistojen keruuseen ja analyysivaiheen hallintaan sekä tutkimusaineistojen käyttöön. Muistutettakoon, että Suomen Akatemia edellyttää kaikilla tieteenaloilla rahoituksen hakijoilta aineistohallinnan suunnittelua osana tutkimussuunnitelmaa.

Ydinviestin ohella tietoarkistolla on muutosviesti. Piakkoin ilmestyvä, painetun Tietoarkisto-lehden uusi numero valottaa tietoarkistojen eurooppalaisen yhteistyön syvenemistä. Lisäksi se esittelee muita yhteiskuntatieteiden ja humanististen tieteenalojen eurooppalaisia tutkimusinfrastruktuureja, joiden kehittäminen on kuulunut jo tovin tutkimuksen kehittämisen painoaloihin EU:ssa. Kiitos jälleen kerran Helena Laaksoselle lehden kokoamisesta.

Valmistautuminen eurooppalaiseen CESSDA-yhteistyöhön on tarjonnut tietoarkistolle väylän myös kansallisten palvelujen laajentamiseen ja vahvistamiseen. Tämä alkaa näkyä erityisesti vuodesta 2014 alkaen, kun jo käynnissä olleet, Suomen Akatemian rahoittamat kehittämishankkeet tuottavat näkyviä muutoksia palveluihimme.

Ensi vuoden alussa tietoarkiston tallentamien aineistojen tilaus- ja toimitusjärjestelmä muuttuu sähköiseksi, jolloin rekisteröityneet käyttäjät saavat data-aineistot käyttöönsä suoraan verkosta. Yliopisto- ja ammattikorkeakoulukäyttäjät voivat käyttää aineistopalvelujamme oppilaitoksensa käyttäjätunnuksella. Aineistojen tilaus- ja toimitusjärjestelmän uudistus on ollut erittäin mittava työkokonaisuus, josta ovat vastanneet osana Tietoarkisto 2015 -hanketta yksikön kaksi toiminnallista osastoa, aineistopalvelut ja tekniset palvelut. Vastuullisille kuuluu iso kiitos urakasta.

Peruspalvelumme ovat avoimesti ja maksutta käytössänne. Tämä on edelleen ydinviestimme. Muutosviestimme on palveluiltaan vahvistuva ja laajeneva tietoarkisto.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Kaksi viestiä

Yliopistojen ulkoinen tiedeviestintä tuntuu muuttuvan etupainotteiseksi elvistelyksi. Liian paljon keskitytään esittelemään aikomuksia ja saadun tutkimusrahoituksen määrää. No – mitä isot edellä, sitä pienet perässä. Tietoarkistokin sai juuri mittavan rahoituksen Suomen Akatemialta toimintojensa vahvistamiseen. Kuinka ollakaan, omakin uutisointimme muisti mainita muhkean rahasumman.

Yksikkömme kaltaiselle tuki-infrastruktuurille ei tarjoudu liian usein mahdollisuuksia kertoa toiminnastaan laajalle yleisölle. Viestintämme on enimmäkseen kansallisen ja kansainvälisen tutkimusyhteisön sisäistä. Sen pääkohteita ovat yliopistot, tutkimusorganisaatiot ja muut tutkimusaineistoja keräävät, teettävät ja käyttävät tahot. Palvelujemme pääkäyttäjäryhmiä ovat tutkijat, opettajat ja opiskelijat.

Ydinviestimme kaikille on palvelujemme maksuton käyttömahdollisuus ja niiden hyödyllisyys tutkimusaineistojen elinkaaren hallinnan ja aktiivisen, avoimen käytön kannalta. Meille voi ja kannattaa arkistoida tutkimusaineistonsa, koska sitä kautta se dokumentoidaan kansainvälisen kuvailukäytännön mukaan. Aineistolle annetaan aineistoviite, tutkimusdata julkaistaan ja siihen voidaan viitata. Julkaistu aineisto on tuottajalleen tieteellinen meriitti. Tutkimuseettisen neuvottelukunnan ja keskeisten tiederahoittajien nykysuosituksen mukaan julkaistujen tutkimusdatojen aineistoviitteet liitetään tutkimuksen harjoittajan ansioluetteloon muiden julkaisujen tavoin.

Tutkimusaineistoihin viittaamista tietoarkisto tukee kääntämällä tarvittaessa aineiston kuvailun englanniksi. Näin aineisto voidaan liittää kansainvälisiin tutkimusaineistotietokantoihin. Kvantitatiivisten tutkimusaineistojen osalta kielenkäännökset kattavat data-aineiston muuttujakuvauksineen.

Tutkimusaineistojen jatkokäyttäjille tarjoamme monipuolisia ja muitakin kuin yhteiskuntatieteitä tukevia palveluja. Aineistosivujen ohella verkkosivujemme keskeisiä sisältöjä ovat Tutkimusaineistojen tiedonhallinnan käsikirja ja Menetelmäopetuksen tietovaranto. Ne ovat laaja-alaisia oppaita tutkimusaineistojen keruuseen ja analyysivaiheen hallintaan sekä tutkimusaineistojen käyttöön. Muistutettakoon, että Suomen Akatemia edellyttää kaikilla tieteenaloilla rahoituksen hakijoilta aineistohallinnan suunnittelua osana tutkimussuunnitelmaa.

Ydinviestin ohella tietoarkistolla on muutosviesti. Piakkoin ilmestyvä, painetun Tietoarkisto-lehden uusi numero valottaa tietoarkistojen eurooppalaisen yhteistyön syvenemistä. Lisäksi se esittelee muita yhteiskuntatieteiden ja humanististen tieteenalojen eurooppalaisia tutkimusinfrastruktuureja, joiden kehittäminen on kuulunut jo tovin tutkimuksen kehittämisen painoaloihin EU:ssa. Kiitos jälleen kerran Helena Laaksoselle lehden kokoamisesta.

Valmistautuminen eurooppalaiseen CESSDA-yhteistyöhön on tarjonnut tietoarkistolle väylän myös kansallisten palvelujen laajentamiseen ja vahvistamiseen. Tämä alkaa näkyä erityisesti vuodesta 2014 alkaen, kun jo käynnissä olleet, Suomen Akatemian rahoittamat kehittämishankkeet tuottavat näkyviä muutoksia palveluihimme.

Ensi vuoden alussa tietoarkiston tallentamien aineistojen tilaus- ja toimitusjärjestelmä muuttuu sähköiseksi, jolloin rekisteröityneet käyttäjät saavat data-aineistot käyttöönsä suoraan verkosta. Yliopisto- ja ammattikorkeakoulukäyttäjät voivat käyttää aineistopalvelujamme oppilaitoksensa käyttäjätunnuksella. Aineistojen tilaus- ja toimitusjärjestelmän uudistus on ollut erittäin mittava työkokonaisuus, josta ovat vastanneet osana Tietoarkisto 2015 -hanketta yksikön kaksi toiminnallista osastoa, aineistopalvelut ja tekniset palvelut. Vastuullisille kuuluu iso kiitos urakasta.

Peruspalvelumme ovat avoimesti ja maksutta käytössänne. Tämä on edelleen ydinviestimme. Muutosviestimme on palveluiltaan vahvistuva ja laajeneva tietoarkisto.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Uusi CESSDA palvelee tutkijoita

Useimmissa Euroopan maissa toimii kansallinen yhteiskuntatieteellinen data-arkisto. Näiden yhteistyössä saavutettiin juhannusviikolla merkittävä virstanpylväs, kun Bergenissä järjestettiin alan uuden eurooppalaisen tutkimusinfrastruktuurin aloittamiskokous. Yleiskokoukseen osallistui 15 eri maasta yli kaksikymmentä asiantuntijaa, jotka edustivat maidensa tutkimuksesta vastaavia ministeriöitä ja muita keskeisiä tutkimusrahoittajia.

Uuden CESSDA-infrastruktuurin palvelut perustuvat paljolti kansallisten palveluntuottajien toimintaan, jossa alan yhteistyö alkoi jo 1970-luvun puolivälissä. Vanhasta CESSDAsta (Council of European Social Science Data Archives) säilyy uuden CESSDAn nimeen lyhenne, mutta yhteistyö muuttuu täysin sekä hallinnollisesti että toimintamalliltaan.

Uusi konsortiomuotoinen yhteistyö tulee rakentumaan eurooppalaisille tutkimusinfrastruktuureille räätälöityyn ERIC-muotoon. Tutkimusinfrastruktuurin jäseniksi liittyvät jäsenvaltiot, eivät itse palveluyksiköt. Kussakin osallistujamaassa jäsenvaltio valitsee palveluntuottajansa ja Suomessa tehtävää hoitaa tietoarkisto. Uuden CESSDAn päärahoittajia ovat Norja ja Saksa, joihin sijoitetaan infrastruktuurin keskuspalvelut. CESSDAn ”pääkonttori” aloittaa toimintansa Bergenissä kuluvan vuoden syksyllä. Keskustoimintojen vuosibudjetti on 1,9 miljoonaa euroa.

Tietoarkistolle uusi yhteistyö tuo mukanaan uusia palveluvelvoitteita, jota varten FSD:ssä on käynnissä useita kehittämishankkeita. Tietoarkiston tavoitteena on luoda lähivuosina sellainen palveluvalmius, osaamistaso ja tekninen infrastruktuuri, että ne mahdollistavat Suomen palvelujen saumattoman integroinnin uuteen eurooppalaiseen järjestelmään. Suomen tietoarkiston tavoitteena on mahdollisimman aktiivinen osallistuminen uuden CESSDAn kehittämiseen.

Kansalliset tietoarkistot ja niiden toimintaa koordinoiva uusi CESSDA palvelevat tutkimusta ja opetusta. Tavoitteena on palvelumalli, jossa tutkijat rekisteröidään ja valtuutetaan CESSDAn palvelujen käyttäjiksi välttäen päällekkäisiä teknisiä ratkaisuja. Järjestelmien valmistuttua esimerkiksi suomalaisen yliopistotutkijan tunnistautuminen ja käyttövaltuuksien myöntäminen CESSDAn verkkopalveluihin perustuu hänen peruspalvelutunnukseensa.

CESSDAn aineistovaranto on jo nyt laaja ja se kasvaa vielä merkittävästi. Tutkimusaineistoja kootaan temaattisiksi kokonaisuuksiksi paljon nykyistä kattavammin, useammilta aloilta ja useammista maista. Datan harmonisointiin ja muuhun käytön helpottamiseen suunnataan uusia resursseja. Näin tutkijat voivat hakea, löytää ja saada käyttöönsä selvästi nykyistä osuvammin ja tehokkaammin tutkimuskysymyksiinsä soveltuvia aineistoja.

Kaikkiaan uusi CESSDA tukee hyvin laaja-alaisesti tutkimuksen ja tutkimusdatan avoimuutta ja avointa käyttöä sekä mahdollisimman korkeatasoisen yhteiskuntatieteellisen tutkimuksen edellytyksiä.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi