Tag Archives: avoimuus

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Suomalaisen tutkimuksen asema on varmistettava!

Tutkimus on ottamassa aimo harppauksen kohti tiedon entistä nopeampaa kertymistä ja tehokkaampaa tutkimusrahoituksen käyttöä. Avoin julkaiseminen saattaa tutkimusryhmien tulokset aiempaa nopeammin muiden tutkijoiden käyttöön. Tutkimusaineistojen avaaminen tuo mukanaan vielä suuremman muutoksen: se mahdollistaa tutkimusaineistojen monipuolisen käytön useilla tieteenaloilla, lisää poikkitieteellistä tutkimusta ja vähentää aineistojen kertakäyttöisyyttä sekä päällekkäisen tiedon keruuta.

Avoin julkaiseminen ja tutkimusaineistojen avaaminen ovatkin saaneet taakseen suuren joukon valtioita, mukaan lukien Suomen, EU:n tutkimussiiven ja suuren joukon kansainvälisiä tiedelehtiä. Avoimuuden kannattajien joukko myös kasvaa koko ajan.

EU:n tietosuoja-asetus määrittelee tutkittavien tietosuojan

Tutkimusaineistojen avaaminen muun tiedeyhteisön käyttöön ei kuitenkaan voi tapahtua ilman tarkkaa harkintaa. Erityisesti huolenaiheena ovat tutkittavien tietosuoja ja se, miten taataan, että yksilöllä on määräysvalta hänestä kerättyjen tietojen käyttämiseen.

EU:n uusi tietosuoja-asetus vastaa edellä mainittuihin huolenaiheisiin. Siinä on määritelty tarkkaan tutkittavilta kerättävän suostumuksen ja informoinnin muoto sekä se, mitä ihmisiä koskevaa tietoa saa käyttää tutkimuksessa ja millä ehdoin.

Tässä vaiheessa lukijaa kenties kummastuttaa, mikä tilanteessa sitten on ongelma. Jos asetus on valmis ja se tulee voimaan sellaisenaan ilman ratifioimisvaatimusta jäsenvaltioilta, eikö asia ole selvä?

Kansallinen ohjeistus asetuksen tulkintaan puuttuu

Tietosuoja-asetuksessa, niin kuin kaikissa lakiteksteissä, ongelmana on kuitenkin pykälien tulkinta. Vaikka asetus sisältää pitkän johdanto-osan, jossa selvitetään mitä sen säätäjät ovat artikloita kirjoittaessansa tarkoittaneet, tulkinnanvaraa jää silti. Lisäksi monessa kohtaa asetusta on teksti, jossa on kirjoitettu, että kansallisessa lainsäädännössä on mahdollisuus säätää tarkemmista vaatimuksista.

Tutkimuksen aseman ongelmallisuus astuu esiin tässä: Meillä ei ole vielä kansallista ohjeistusta siitä, miten asetusta pitää tulkita tutkimuskontekstissa. Vielä vähemmän meillä on tietoa siitä, aiotaanko asetuksen kansallista säätelyvaraa käyttää tiukentavaan suuntaan ja jos, kuinka paljon tiukempaan.

Tutkimuksen tekeminen vaatii paljon aikaa ja suunnittelua. Asetus tulee voimaan kahden vuoden kuluttua. Tuolloin käytettäviä tutkimusaineistoja ollaan joko keräämässä nyt tai niiden keräämistä suunnitellaan parhaillaan. Jotta asetusta päästään noudattamaan 2018, sen tulkinnan pitäisi olla tiedossa nyt, kun tutkittavilta on mahdollisuus ilman suuria lisäkustannuksia hankkia uuden asetuksen mukainen informoitu suostumus. Lääketieteellistä tutkimusta ei saa aloittaa ennen kuin se on saanut eettiseltä toimikunnalta myönteisen lausunnon. Eettisten toimikuntien täytyisikin pystyä antamaan eettiset lausunnot jo nyt uuden asetuksen mukaisesti. Sama koskee luonnollisesti myös muiden ihmistieteiden eettisiä toimikuntia.

Alueelliset toimikunnat tarvitsevat yhteiset pelisäännöt

Vallitsevassa tilanteessa eettisten toimikuntien on tehtävä ratkaisunsa tulkitsemalla asetusta mahdollisimman tiukasti, jotta asetuksen ehdot varmasti täyttyvät. Todennäköisesti myös alueellisten toimikuntien ratkaisut poikkeavat yhteisten pelisääntöjen puuttuessa toisistaan vielä entistä enemmän – alueellisia toimikuntia moitittiin jo nyt keskenään ristiriitaisista ratkaisuista työ- ja elinkeinoministeriön teettämässä selvityksessä terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä1.

Toimikuntien jäsenet tunnistavat ongelman ja ovat hämmentyneitä siitä, millaisia ratkaisuja heidän pitäisi tehdä. Heiltä kuitenkin puuttuvat välineet tehdä asialle mitään konkreettista. Tietoarkistoon on ollut yhteydessä useampi eettisten toimikuntien jäsen, mutta meidänkin on vastattava, ettemme valitettavasti vielä tiedä, miten asetusta pitäisi tulkita.

Epätietoisuus voi pudottaa Suomen kansainväliseltä pelikentältä

Ongelma on suurempi kuin nyt suunniteltavien tutkimusaineistojen tarkoituksenmukaista suppeampi käyttömahdollisuus ja sitä kautta resurssien alikäyttö. Kansainvälisesti tutkimusaineistojen avoimuus on saanut suuren kannattajakunnan. Kansainvälisistä tiedejulkaisuista huomattava osa (mm. PLOSone, useat BioMed Centralin jäsenlehdistä, PNAS, Nature ja NEJM) vaatii tutkimusjulkaisun ehdoksi datan saattamista avoimeksi. ICMJE:n ehdotuksen (International Committee of Medical Journal Editors) mukaan tulevaisuudessa hyväksytään julkaistavaksi vain sellaisten kliinisten tutkimusten tulokset, joiden taustalla oleva tutkimusaineisto avataan.

Jos ICMJE:n ehdotus menee läpi ja muut tiedejulkaisut kiristävät samalla omia avoimuusvaatimuksiaan, suomalaisten tutkijoiden mahdollisuus saada tutkimustuloksensa julkaistua heikkenevät olennaisesti. Kansainvälisiin rahoituksiin vaaditaan hyviä julkaisuja, joten myös niiden saaminen vaarantuu. Kansainvälisiin konsortioihin tuskin tulevaisuudessa kelpuutetaan tutkimusryhmiä, joiden aineistoja ei saa avata julkaisun yhteydessä samaan tapaan kuin muita aineistoja.

Tulkintalinjauksia tutkimukselle kaivataan

Oikeusministeriö on asettanut työryhmän käymään läpi suomalaisen lainsäädännön ongelmakohtia uuden tietosuoja-asetuksen näkökulmasta2. Alustavan arvion mukaan nykyisistä säännöksistä useassa sadassa ohjeistetaan henkilötietojen käsittelystä. Työryhmän on määrä tuottaa muutosehdotukset kesään 2017 mennessä. Myös sosiaali- ja terveysministeriössä työstetään uutta lakia, jossa säädetään sosiaali- ja terveydenhuollon asiakastietojen toissijaisesta käytöstä3. Näiden sekä uuden tietosuoja-asetuksen ansiosta tulevaisuudessa siis lainsäädäntömme voikin olla tutkimuksen osalta huomattavasti selkeämpi kuin se nyt on.

Tulkintakäytäntöjä kuitenkin tarvittaisiin jo ennen kuin tietosuoja-asetus astuu voimaan, jotta tutkijat voivat julkaista tuloksensa ja käyttää aineistojaan jatkotutkimuksissa. Salokanteleen4 mukaan suostumuksella saatujen aineistojen suostumusten on oltava asetuksen mukaisia asetuksen voimaan astuttua, jos henkilötietojen käsittelyä aiotaan jatkaa. Minkä sääntöjen pohjalta eettiset toimikunnat antavat lausuntonsa uusille tutkimuksille? Millä ehdoin Tietoarkisto, Kielipankki ja muut kansalliset tutkimusaineistojen arkistot voivat tallettaa aineistoja ja neuvoa tutkijoita pyytämään uusiin tutkimuksiin asetuksen mukaiset suostumukset?

Tarvitsemme selkeän linjauksen, joka ilmaisee lainsäätäjien näkemyksen siitä, mihin suuntaan Suomen tutkimuksessa tähdätään niin pian kuin mahdollista. Asetuksen edellyttämiä muutoksia käsittelevällä työryhmällä on mahdollisuus jakautua jaoksiin. Tulisiko tutkimusta varten asettaa oma jaos?

Tutkijoilta ja eettisiltä toimikunnilta vaaditaan päätöksiä nyt. Vuonna 2018 tietosuoja-asetuksen voimaan tullessa on monen tutkimuksen osalta myöhäistä.

Lähteet:
1 OwalGroup (2015). Selvitys terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä.
2 Oikeusministeriö, lakihankkeet. Henkilötietojen suojaa koskevan kansallisen lainsäädännön tarkistaminen.
3 Sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskevaa lainsäädäntöä valmisteleva työryhmä: Työryhmä- ja hankekuvaus ja Lainsäädäntöryhmän työskentelytila
4 Marjut Salokannel (2016). EU:n tietosuoja-asetus ja terveystietojen tutkimuskäyttö. Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa, seminaari 17.3.2016. (pdf)

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Suomalaisen tutkimuksen asema on varmistettava!

Tutkimus on ottamassa aimo harppauksen kohti tiedon entistä nopeampaa kertymistä ja tehokkaampaa tutkimusrahoituksen käyttöä. Avoin julkaiseminen saattaa tutkimusryhmien tulokset aiempaa nopeammin muiden tutkijoiden käyttöön. Tutkimusaineistojen avaaminen tuo mukanaan vielä suuremman muutoksen: se mahdollistaa tutkimusaineistojen monipuolisen käytön useilla tieteenaloilla, lisää poikkitieteellistä tutkimusta ja vähentää aineistojen kertakäyttöisyyttä sekä päällekkäisen tiedon keruuta.

Avoin julkaiseminen ja tutkimusaineistojen avaaminen ovatkin saaneet taakseen suuren joukon valtioita, mukaan lukien Suomen, EU:n tutkimussiiven ja suuren joukon kansainvälisiä tiedelehtiä. Avoimuuden kannattajien joukko myös kasvaa koko ajan.

EU:n tietosuoja-asetus määrittelee tutkittavien tietosuojan

Tutkimusaineistojen avaaminen muun tiedeyhteisön käyttöön ei kuitenkaan voi tapahtua ilman tarkkaa harkintaa. Erityisesti huolenaiheena ovat tutkittavien tietosuoja ja se, miten taataan, että yksilöllä on määräysvalta hänestä kerättyjen tietojen käyttämiseen.

EU:n uusi tietosuoja-asetus vastaa edellä mainittuihin huolenaiheisiin. Siinä on määritelty tarkkaan tutkittavilta kerättävän suostumuksen ja informoinnin muoto sekä se, mitä ihmisiä koskevaa tietoa saa käyttää tutkimuksessa ja millä ehdoin.

Tässä vaiheessa lukijaa kenties kummastuttaa, mikä tilanteessa sitten on ongelma. Jos asetus on valmis ja se tulee voimaan sellaisenaan ilman ratifioimisvaatimusta jäsenvaltioilta, eikö asia ole selvä?

Kansallinen ohjeistus asetuksen tulkintaan puuttuu

Tietosuoja-asetuksessa, niin kuin kaikissa lakiteksteissä, ongelmana on kuitenkin pykälien tulkinta. Vaikka asetus sisältää pitkän johdanto-osan, jossa selvitetään mitä sen säätäjät ovat artikloita kirjoittaessansa tarkoittaneet, tulkinnanvaraa jää silti. Lisäksi monessa kohtaa asetusta on teksti, jossa on kirjoitettu, että kansallisessa lainsäädännössä on mahdollisuus säätää tarkemmista vaatimuksista.

Tutkimuksen aseman ongelmallisuus astuu esiin tässä: Meillä ei ole vielä kansallista ohjeistusta siitä, miten asetusta pitää tulkita tutkimuskontekstissa. Vielä vähemmän meillä on tietoa siitä, aiotaanko asetuksen kansallista säätelyvaraa käyttää tiukentavaan suuntaan ja jos, kuinka paljon tiukempaan.

Tutkimuksen tekeminen vaatii paljon aikaa ja suunnittelua. Asetus tulee voimaan kahden vuoden kuluttua. Tuolloin käytettäviä tutkimusaineistoja ollaan joko keräämässä nyt tai niiden keräämistä suunnitellaan parhaillaan. Jotta asetusta päästään noudattamaan 2018, sen tulkinnan pitäisi olla tiedossa nyt, kun tutkittavilta on mahdollisuus ilman suuria lisäkustannuksia hankkia uuden asetuksen mukainen informoitu suostumus. Lääketieteellistä tutkimusta ei saa aloittaa ennen kuin se on saanut eettiseltä toimikunnalta myönteisen lausunnon. Eettisten toimikuntien täytyisikin pystyä antamaan eettiset lausunnot jo nyt uuden asetuksen mukaisesti. Sama koskee luonnollisesti myös muiden ihmistieteiden eettisiä toimikuntia.

Alueelliset toimikunnat tarvitsevat yhteiset pelisäännöt

Vallitsevassa tilanteessa eettisten toimikuntien on tehtävä ratkaisunsa tulkitsemalla asetusta mahdollisimman tiukasti, jotta asetuksen ehdot varmasti täyttyvät. Todennäköisesti myös alueellisten toimikuntien ratkaisut poikkeavat yhteisten pelisääntöjen puuttuessa toisistaan vielä entistä enemmän – alueellisia toimikuntia moitittiin jo nyt keskenään ristiriitaisista ratkaisuista työ- ja elinkeinoministeriön teettämässä selvityksessä terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä1.

Toimikuntien jäsenet tunnistavat ongelman ja ovat hämmentyneitä siitä, millaisia ratkaisuja heidän pitäisi tehdä. Heiltä kuitenkin puuttuvat välineet tehdä asialle mitään konkreettista. Tietoarkistoon on ollut yhteydessä useampi eettisten toimikuntien jäsen, mutta meidänkin on vastattava, ettemme valitettavasti vielä tiedä, miten asetusta pitäisi tulkita.

Epätietoisuus voi pudottaa Suomen kansainväliseltä pelikentältä

Ongelma on suurempi kuin nyt suunniteltavien tutkimusaineistojen tarkoituksenmukaista suppeampi käyttömahdollisuus ja sitä kautta resurssien alikäyttö. Kansainvälisesti tutkimusaineistojen avoimuus on saanut suuren kannattajakunnan. Kansainvälisistä tiedejulkaisuista huomattava osa (mm. PLOSone, useat BioMed Centralin jäsenlehdistä, PNAS, Nature ja NEJM) vaatii tutkimusjulkaisun ehdoksi datan saattamista avoimeksi. ICMJE:n ehdotuksen (International Committee of Medical Journal Editors) mukaan tulevaisuudessa hyväksytään julkaistavaksi vain sellaisten kliinisten tutkimusten tulokset, joiden taustalla oleva tutkimusaineisto avataan.

Jos ICMJE:n ehdotus menee läpi ja muut tiedejulkaisut kiristävät samalla omia avoimuusvaatimuksiaan, suomalaisten tutkijoiden mahdollisuus saada tutkimustuloksensa julkaistua heikkenevät olennaisesti. Kansainvälisiin rahoituksiin vaaditaan hyviä julkaisuja, joten myös niiden saaminen vaarantuu. Kansainvälisiin konsortioihin tuskin tulevaisuudessa kelpuutetaan tutkimusryhmiä, joiden aineistoja ei saa avata julkaisun yhteydessä samaan tapaan kuin muita aineistoja.

Tulkintalinjauksia tutkimukselle kaivataan

Oikeusministeriö on asettanut työryhmän käymään läpi suomalaisen lainsäädännön ongelmakohtia uuden tietosuoja-asetuksen näkökulmasta2. Alustavan arvion mukaan nykyisistä säännöksistä useassa sadassa ohjeistetaan henkilötietojen käsittelystä. Työryhmän on määrä tuottaa muutosehdotukset kesään 2017 mennessä. Myös sosiaali- ja terveysministeriössä työstetään uutta lakia, jossa säädetään sosiaali- ja terveydenhuollon asiakastietojen toissijaisesta käytöstä3. Näiden sekä uuden tietosuoja-asetuksen ansiosta tulevaisuudessa siis lainsäädäntömme voikin olla tutkimuksen osalta huomattavasti selkeämpi kuin se nyt on.

Tulkintakäytäntöjä kuitenkin tarvittaisiin jo ennen kuin tietosuoja-asetus astuu voimaan, jotta tutkijat voivat julkaista tuloksensa ja käyttää aineistojaan jatkotutkimuksissa. Salokanteleen4 mukaan suostumuksella saatujen aineistojen suostumusten on oltava asetuksen mukaisia asetuksen voimaan astuttua, jos henkilötietojen käsittelyä aiotaan jatkaa. Minkä sääntöjen pohjalta eettiset toimikunnat antavat lausuntonsa uusille tutkimuksille? Millä ehdoin Tietoarkisto, Kielipankki ja muut kansalliset tutkimusaineistojen arkistot voivat tallettaa aineistoja ja neuvoa tutkijoita pyytämään uusiin tutkimuksiin asetuksen mukaiset suostumukset?

Tarvitsemme selkeän linjauksen, joka ilmaisee lainsäätäjien näkemyksen siitä, mihin suuntaan Suomen tutkimuksessa tähdätään niin pian kuin mahdollista. Asetuksen edellyttämiä muutoksia käsittelevällä työryhmällä on mahdollisuus jakautua jaoksiin. Tulisiko tutkimusta varten asettaa oma jaos?

Tutkijoilta ja eettisiltä toimikunnilta vaaditaan päätöksiä nyt. Vuonna 2018 tietosuoja-asetuksen voimaan tullessa on monen tutkimuksen osalta myöhäistä.

Lähteet:
1 OwalGroup (2015). Selvitys terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä.
2 Oikeusministeriö, lakihankkeet. Henkilötietojen suojaa koskevan kansallisen lainsäädännön tarkistaminen.
3 Sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskevaa lainsäädäntöä valmisteleva työryhmä: Työryhmä- ja hankekuvaus ja Lainsäädäntöryhmän työskentelytila
4 Marjut Salokannel (2016). EU:n tietosuoja-asetus ja terveystietojen tutkimuskäyttö. Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa, seminaari 17.3.2016. (pdf)

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Terveystietoja sisältävien tutkimusaineistojen arkistointi – tutkija vaatimusten ristitulessa

Suomalaiset tutkijat keräävät valtavasti tietoa ihmisistä ja ihmisten käyttäytymisestä. Lisäksi terveysalan viranomaiset ja tutkimuslaitokset keräävät lakisääteisesti mittavia tietovarantoja väestön palveluiden käytöstä ja terveydentilasta. Kerätty tieto olisi lääketieteen, kansanterveyden ja yhteiskunnan kannalta erinomaista, mutta sitä ei voida käyttää täysimääräisesti hyväksi.

Ongelmat johtuvat osittain tiukasta henkilötietolaista ja sen tulkinnasta, joka estää täysin biopankkilain ulkopuolelle jäävien tutkimusaineistojen arkistoimisen tunnisteellisena. Osittain kyse on siitä, että tutkittavien suostumus ja eettisen toimikunnan lausunto on tapana pyytää sellaisessa muodossa, että ne mahdollistavat aineiston käytön vain kyseiseen tutkimukseen.

Rekisteritietojen saatavuuskin on vaikeaa. Rekisteriaineistojen tietoteknisestä turvallisuudesta on huolehdittu, mutta aineistoja ei ole järjestelmällisesti kuvailtu, eikä niitä pysty hakemaan yksinkertaisesti. Hakuprosessit vievät pahimmillaan vuosia, ja aineiston käytöstä joutuu maksamaan jopa tuhansia euroja. Saadut aineistot ovat raakadataa, joka voi vaatia huomattavan paljon työstämistä ennen kuin aineisto on käyttökelpoista tutkimukseen.

Samaan aikaan kansalliset ja kansainväliset rahoittajat suosittelevat tai edellyttävät tutkimusaineistojen avaamista. Tieteelliset julkaisut voivat pitää tutkimusaineiston avaamista jopa julkaisun ehtona. Tutkijan taas täytyisi saada pitää aineistonsa itsellään, kunnes on saanut oman tutkimustuloksensa julkaistua.

Hankkeeseen saa rahoitusta, jos pystyy osoittamaan, että käytössä on tutkimusongelmaan sopiva aineisto. Aineiston käyttöön saaminen kuitenkin vaatii huomattavaa rahallista panostusta, mikä on ongelma siinä vaiheessa kun rahoitusta ollaan vasta hakemassa. Lisäksi tutkimusrahoitus on määräaikaista. Mitä tehdä, jos kolmen vuoden tutkimusrahoituskaudesta kaksi vuotta kuluu eettisten lausuntojen, aineistonkäyttölupien ja lopulta itse aineistojen saamiseen?

Ongelmiin on onneksi havahduttu. Tutkimuksen asema tulee toivon mukaan parantumaan EU:n tietosuoja-asetuksen myötä (1). Myös SOTE-tiedon toissijaisen käytön lainsäädäntö (2) tulee helpottamaan aineistojen saamista tutkimukseen. Kansallinen palveluoperaattori (3) on aikanaan toteutuessaan yhden luukun palvelu, josta tutkija voi etsiä tietoa olemassa olevista aineistoista, hakea niihin käyttölupaa, hankkia eettisen lausunnon ja lopulta saada aineiston käyttöönsä kohtuullisessa ajassa. Kaikkein arkaluonteisinta tietoa varten suunnitellaan etäkäyttöjärjestelmää, jossa aineiston pääsisi analysoimaan vaarantamatta tutkittavien tietosuojaa.

Rekisteriviranomaisista avoimuuden edelläkävijä on THL, joka on jo parantamassa aineistojensa näkyvyyttä ja helpottamassa tutkijoiden luvanhakua ja aineistonsaantia. Organisaation uusi datapolitiikka on luettavissa THL:n sivuilla.

Tietoarkisto osallistuu yhteisen tavoitteen saavuttamiseen tarjoamalla kerätyille tutkimusaineistoille luotettavan säilytyspaikan sekä helpon palveluportaalin, Ailan. Ailassa tutkija voi selata olemassa olevia aineistoja ja tutkia niiden keräystapaa ja sisältöä aineistokuvailun perusteella. Kun sopiva aineisto löytyy, sen saa parhaimmillaan käyttöönsä heti. Kaikkein tiukimman käyttöluokituksen aineistoissakin Tietoarkisto hoitaa käyttölupapyynnön aineiston haltijalle ja toimittaa aineiston heti, kun lupa on saatu.

Tulevaisuus näyttää siis onneksi nykyhetkeä kirkkaammalta.

1http://ec.europa.eu/justice/data-protection/reform/index_en.htm
2https://www.innokyla.fi/web/verkosto1598477
3http://www.sitra.fi/hankkeet/isaacus-esituotantohankkeet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan viimeinen osa. Ks. ensimmäinen ja toinen osa.

Terveystietoja sisältävien tutkimusaineistojen arkistointi – tutkija vaatimusten ristitulessa

Suomalaiset tutkijat keräävät valtavasti tietoa ihmisistä ja ihmisten käyttäytymisestä. Lisäksi terveysalan viranomaiset ja tutkimuslaitokset keräävät lakisääteisesti mittavia tietovarantoja väestön palveluiden käytöstä ja terveydentilasta. Kerätty tieto olisi lääketieteen, kansanterveyden ja yhteiskunnan kannalta erinomaista, mutta sitä ei voida käyttää täysimääräisesti hyväksi.

Ongelmat johtuvat osittain tiukasta henkilötietolaista ja sen tulkinnasta, joka estää täysin biopankkilain ulkopuolelle jäävien tutkimusaineistojen arkistoimisen tunnisteellisena. Osittain kyse on siitä, että tutkittavien suostumus ja eettisen toimikunnan lausunto on tapana pyytää sellaisessa muodossa, että ne mahdollistavat aineiston käytön vain kyseiseen tutkimukseen.

Rekisteritietojen saatavuuskin on vaikeaa. Rekisteriaineistojen tietoteknisestä turvallisuudesta on huolehdittu, mutta aineistoja ei ole järjestelmällisesti kuvailtu, eikä niitä pysty hakemaan yksinkertaisesti. Hakuprosessit vievät pahimmillaan vuosia, ja aineiston käytöstä joutuu maksamaan jopa tuhansia euroja. Saadut aineistot ovat raakadataa, joka voi vaatia huomattavan paljon työstämistä ennen kuin aineisto on käyttökelpoista tutkimukseen.

Samaan aikaan kansalliset ja kansainväliset rahoittajat suosittelevat tai edellyttävät tutkimusaineistojen avaamista. Tieteelliset julkaisut voivat pitää tutkimusaineiston avaamista jopa julkaisun ehtona. Tutkijan taas täytyisi saada pitää aineistonsa itsellään, kunnes on saanut oman tutkimustuloksensa julkaistua.

Hankkeeseen saa rahoitusta, jos pystyy osoittamaan, että käytössä on tutkimusongelmaan sopiva aineisto. Aineiston käyttöön saaminen kuitenkin vaatii huomattavaa rahallista panostusta, mikä on ongelma siinä vaiheessa kun rahoitusta ollaan vasta hakemassa. Lisäksi tutkimusrahoitus on määräaikaista. Mitä tehdä, jos kolmen vuoden tutkimusrahoituskaudesta kaksi vuotta kuluu eettisten lausuntojen, aineistonkäyttölupien ja lopulta itse aineistojen saamiseen?

Ongelmiin on onneksi havahduttu. Tutkimuksen asema tulee toivon mukaan parantumaan EU:n tietosuoja-asetuksen myötä (1). Myös SOTE-tiedon toissijaisen käytön lainsäädäntö (2) tulee helpottamaan aineistojen saamista tutkimukseen. Kansallinen palveluoperaattori (3) on aikanaan toteutuessaan yhden luukun palvelu, josta tutkija voi etsiä tietoa olemassa olevista aineistoista, hakea niihin käyttölupaa, hankkia eettisen lausunnon ja lopulta saada aineiston käyttöönsä kohtuullisessa ajassa. Kaikkein arkaluonteisinta tietoa varten suunnitellaan etäkäyttöjärjestelmää, jossa aineiston pääsisi analysoimaan vaarantamatta tutkittavien tietosuojaa.

Rekisteriviranomaisista avoimuuden edelläkävijä on THL, joka on jo parantamassa aineistojensa näkyvyyttä ja helpottamassa tutkijoiden luvanhakua ja aineistonsaantia. Organisaation uusi datapolitiikka on luettavissa THL:n sivuilla.

Tietoarkisto osallistuu yhteisen tavoitteen saavuttamiseen tarjoamalla kerätyille tutkimusaineistoille luotettavan säilytyspaikan sekä helpon palveluportaalin, Ailan. Ailassa tutkija voi selata olemassa olevia aineistoja ja tutkia niiden keräystapaa ja sisältöä aineistokuvailun perusteella. Kun sopiva aineisto löytyy, sen saa parhaimmillaan käyttöönsä heti. Kaikkein tiukimman käyttöluokituksen aineistoissakin Tietoarkisto hoitaa käyttölupapyynnön aineiston haltijalle ja toimittaa aineiston heti, kun lupa on saatu.

Tulevaisuus näyttää siis onneksi nykyhetkeä kirkkaammalta.

1http://ec.europa.eu/justice/data-protection/reform/index_en.htm
2https://www.innokyla.fi/web/verkosto1598477
3http://www.sitra.fi/hankkeet/isaacus-esituotantohankkeet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan viimeinen osa. Ks. ensimmäinen ja toinen osa.

Kun historiantutkijat vaelsivat Joensuuhun – Historiantutkimuksen päivät 22.–24.10.2015 Itä-Suomen yliopistossa

Olo oli oudolla tapaa nostalginen, kun juna kolisutteli pimeää rataosuutta Pieksämäeltä kohti Joensuuta. Vielä hetken on Pohjois-Karjalan maakuntakeskus tavoitettavissa junaillen; maaliskuun 2016 jälkeen sinne ei enää pääse Tampereelta Jyväskylän ja Pieksämäen kautta. Käsillä olivat siis viimeiset hetket vierailla junantuomana Pielisjoen suulle asettuneessa kaupungissa.

Joensuun vierailun syynä olivat 22.–24.10.2015 järjestetyt Historiantutkimuksen päivät, jotka keräsivät kokoon Itä-Suomen yliopiston kampukselle noin 260 historioitsijaa Suomen kaikista historian laitoksista – ja kirsikkana kakun päällä yhden tietoarkistolaisen. Sessioita ja työryhmiä oli kolmen päivän aikana noin seitsemänkymmentä ja esitykset kattoivat aikakausia antiikista nykypäivään. Lisäksi ohjelmaan sisältyi kaksi keynote-luentoa sekä seurustelun ja verkostoitumisen mahdollistavia iltatilaisuuksia. Otolliset ainekset jossain vaiheessa yleensä iskevälle konferenssikoomalle olivat siis lupaavasti kasassa.

Tietoarkistolaisen näkökulmasta päiville osallistumisella oli selkeä tarkoitus: Digitaalisten tutkimusaineistojen avoimuuden ja jatkokäytön edistäminen ei ole vielä vakiintunut humanististen alojen tutkimuskäytöntöihin. Tietoarkiston laajentaessa palveluitaan humanistisille aloille tutkijoiden joukkoon jalkautuminen ja tutkimusaineistojen avoimuuden ilosanoman julistaminen ovat siten ensiarvoisen tärkeitä asioita. Parin päivän aikana käymistäni keskusteluista kävi kuitenkin selväksi, että historiantutkijat alkavat olla enenevässä määrin selvillä avoimen tieteen vaatimuksista tutkimusaineistojen suhteen, ja moni tuntui suhtautuvan asiaan pohjimmiltaan myönteisesti. Tutkimusrahoittajien, kuten Suomen Akatemian suositukset tutkimusaineistojen avaamisesta ovat vaikuttaneet ja vaikuttavat jatkossakin siihen, että tutkijat joutuvat aiempaa aktiivisemmin pohtimaan aineistojen arkistoimiseen ja jatkokäyttöön liittyvää tematiikkaa.

Niinä aikoina, kun en päivystänyt Tietoarkiston pöydän takana, kävin kuuntelemassa esityksiä. Sessioiden valintaan vaikuttivat omat intressini sekä tietoarkistolaisena että keskiajan taiteen tutkijana. Taidehistorian koulutuksen saaneena kuvien tutkijana minua kiinnosti kovasti kuulla, miten historioitsijat käsittelevät ja tutkivat visuaalista aineistoa. Valitsin siten ensimmäiseksi session, jossa käsiteltiin sosiaalisen median kuvamateriaalia, kotialbumien sota-ajan kuvia sekä SA-kuva-arkiston sotavalokuvia digitaalisen humanismin näkökulmasta. Historioitsijat ovat tyypillisesti tottuneet suuntaamaan analyyttisen katseensa ensisijaisesti kohti tekstejä, mutta visuaalinen aines on ehkä historian tutkimuksessa pikkuhiljaa liikahtamassa kuriositeetin tai kuvituksen roolistaan kohti tutkimuksellista keskiötä – tai ainakin sen liepeitä. Historian tutkijat ovat perinteisesti herkkiä kontekstille, ja tämä näkyi onneksi myös esityksissä, vaikka taiteen tutkimuksen näkökulmasta paljon on vielä opittavaa.

Nosteessa olevan digitaalisen humanismin tai tuttavallisemmin digihumanismin tuotteena luodaan usein erilaisia datan visualisointeja ja esimerkiksi esitellyn SA-kuva-arkiston sisällön analyysit olivat muuntuneet kuvapilven muotoon. Erilaiset kuvapilvet havainnollistivat tässä tapauksessa graafisesti eri valokuvien kuvateksteistä poimittujen käsitteiden merkitystä. Datan visualisointi on eittämättä kiinnostava ja havainnollistava tapa esittää kerättyä tietoa, mutta valokuviin liittyvien kuvatekstien muodostamat visualisoinnit nostavat väistämättä sanat merkityksellisempään asemaan kuin varsinaiset kuvat. Tekstintutkija ei tässä välttämättä näe mitään ongelmaa, kuvantutkija kylläkin.

Listalleni päätyi seuraavaksi perinteisempää historiantutkimuksen metodiikkaa kuten keskiajan ja uuden ajan lähdetutkimusta Turun tuomiokirkon Mustasta kirjasta voudintileihin ja Flemingien maakirjoihin. Suuri osa historiantutkijoiden työajasta kuluu edelleen kirjallisen lähdeaineiston analysointiin, eikä sen keskeisyys ole katoamassa. Itselleni kiinnostavaa oli kuulla muun muassa lähdeteoksissa käytetyn paperin vesileima-ajoituksista, joiden perusteella on mahdollista hahmottaa käsikirjojen alkuperäinen kokonaisuus sekä tehdä esimerkiksi melko tarkkoja ajoituksia sen suhteen, milloin jonkin tietyn käsikirjoituksen jokin osa on kirjoitettu tai kuinka monta kirjuria työtä on ollut tekemässä. Toisaalta perinteinen lähdetutkimus voi nykyään kiinnittyä luontevasti digitaaliseen alustaan ja muuntua tietokannaksi, kuten digihumanismin ja perinteikkään historiantutkimuksen ristipaineessa tempoileva voudintilien tutkija aprikoi.

Tässä yhteydessä mainittiin myös itselleni aikaisemmin tuntematon termi ”small big data”, joka viittaa määrällisesti pieneen mutta luonteeltaan ”suureen” dataan, siis eräänlaiseen big datan miniversioon. Puhe big datasta sisältää usein eräänlaisen eeppisen mittasuhteen; määritelläänhän se tyypillisesti valtavista, osin järjestäytymättömistä ja jatkuvasti lisääntyvistä tietomassoista koostuvaksi datamassaksi. Tiedonkeruun kannalta yksittäinen tutkija voi tuntea kauhua määrällisesti valtaisan ja alati laajentuvan tietovarannon kanssa, joten lienee tarpeen pilkkoa käsitettä pienempiin ja paremmin hallittaviin kokonaisuuksiin.

Viimeinen sessio, johon minun oli mahdollista osallistua, käsitteli historiantutkimuksen sähköisiä tutkimusinfrastruktuureja. Esitykset keskittyivät Kansallisarkiston erilaisiin sähköisiin palveluihin, erityisesti digitoitujen karttojen paikkatietojärjestelmän kehittämiseen, heraldisten kokoelmien tietokannan luomiseen ja Suomen keskiajan käsikirjoitusten sähköisen kokoelmatietokannan, Diplomatarium Fennicumin kehittämiseen. Näiden erilaisten sähköisten palvelujen kehittäminen on osa Kansallisarkiston laajempaa tutkimuspalvelustrategiaa, jonka avulla pyritään paremmin vastaamaan erilaisten käyttäjien toiveisiin.

Kuulemieni esitysten perusteella historiantutkimuksen nykytilasta jäi ehkä päällimmäisenä pinnalle digitalisaation haasteet ja sen mukanaan tuomat uudet sovellukset, joita hyödyntämällä tieteenalan on mahdollista suunnata hyvinkin kiinnostaville urille – unohtamatta kuitenkaan perusydintään, lähdekriittistä ja kontekstiherkkää tutkimusotetta.

Historiantutkimuksen päivistä muualla blogosfäärissä:
» Kaisa Kyläkoski: Historiantutkimuksen päivät
» Susanna Ånäs: Olemmeko kaikki historioitsijoita?
» Maria Lähteenmäki: Minne menet historiantutkijoiden ammattikunta tekno-oligarkkien paineen alla?

Lisätietoa:
» SA-kuva-arkisto
» Historiantutkimuksen päivät 2015

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kun historiantutkijat vaelsivat Joensuuhun – Historiantutkimuksen päivät 22.–24.10.2015 Itä-Suomen yliopistossa

Olo oli oudolla tapaa nostalginen, kun juna kolisutteli pimeää rataosuutta Pieksämäeltä kohti Joensuuta. Vielä hetken on Pohjois-Karjalan maakuntakeskus tavoitettavissa junaillen; maaliskuun 2016 jälkeen sinne ei enää pääse Tampereelta Jyväskylän ja Pieksämäen kautta. Käsillä olivat siis viimeiset hetket vierailla junantuomana Pielisjoen suulle asettuneessa kaupungissa.

Joensuun vierailun syynä olivat 22.–24.10.2015 järjestetyt Historiantutkimuksen päivät, jotka keräsivät kokoon Itä-Suomen yliopiston kampukselle noin 260 historioitsijaa Suomen kaikista historian laitoksista – ja kirsikkana kakun päällä yhden tietoarkistolaisen. Sessioita ja työryhmiä oli kolmen päivän aikana noin seitsemänkymmentä ja esitykset kattoivat aikakausia antiikista nykypäivään. Lisäksi ohjelmaan sisältyi kaksi keynote-luentoa sekä seurustelun ja verkostoitumisen mahdollistavia iltatilaisuuksia. Otolliset ainekset jossain vaiheessa yleensä iskevälle konferenssikoomalle olivat siis lupaavasti kasassa.

Tietoarkistolaisen näkökulmasta päiville osallistumisella oli selkeä tarkoitus: Digitaalisten tutkimusaineistojen avoimuuden ja jatkokäytön edistäminen ei ole vielä vakiintunut humanististen alojen tutkimuskäytöntöihin. Tietoarkiston laajentaessa palveluitaan humanistisille aloille tutkijoiden joukkoon jalkautuminen ja tutkimusaineistojen avoimuuden ilosanoman julistaminen ovat siten ensiarvoisen tärkeitä asioita. Parin päivän aikana käymistäni keskusteluista kävi kuitenkin selväksi, että historiantutkijat alkavat olla enenevässä määrin selvillä avoimen tieteen vaatimuksista tutkimusaineistojen suhteen, ja moni tuntui suhtautuvan asiaan pohjimmiltaan myönteisesti. Tutkimusrahoittajien, kuten Suomen Akatemian suositukset tutkimusaineistojen avaamisesta ovat vaikuttaneet ja vaikuttavat jatkossakin siihen, että tutkijat joutuvat aiempaa aktiivisemmin pohtimaan aineistojen arkistoimiseen ja jatkokäyttöön liittyvää tematiikkaa.

Niinä aikoina, kun en päivystänyt Tietoarkiston pöydän takana, kävin kuuntelemassa esityksiä. Sessioiden valintaan vaikuttivat omat intressini sekä tietoarkistolaisena että keskiajan taiteen tutkijana. Taidehistorian koulutuksen saaneena kuvien tutkijana minua kiinnosti kovasti kuulla, miten historioitsijat käsittelevät ja tutkivat visuaalista aineistoa. Valitsin siten ensimmäiseksi session, jossa käsiteltiin sosiaalisen median kuvamateriaalia, kotialbumien sota-ajan kuvia sekä SA-kuva-arkiston sotavalokuvia digitaalisen humanismin näkökulmasta. Historioitsijat ovat tyypillisesti tottuneet suuntaamaan analyyttisen katseensa ensisijaisesti kohti tekstejä, mutta visuaalinen aines on ehkä historian tutkimuksessa pikkuhiljaa liikahtamassa kuriositeetin tai kuvituksen roolistaan kohti tutkimuksellista keskiötä – tai ainakin sen liepeitä. Historian tutkijat ovat perinteisesti herkkiä kontekstille, ja tämä näkyi onneksi myös esityksissä, vaikka taiteen tutkimuksen näkökulmasta paljon on vielä opittavaa.

Nosteessa olevan digitaalisen humanismin tai tuttavallisemmin digihumanismin tuotteena luodaan usein erilaisia datan visualisointeja ja esimerkiksi esitellyn SA-kuva-arkiston sisällön analyysit olivat muuntuneet kuvapilven muotoon. Erilaiset kuvapilvet havainnollistivat tässä tapauksessa graafisesti eri valokuvien kuvateksteistä poimittujen käsitteiden merkitystä. Datan visualisointi on eittämättä kiinnostava ja havainnollistava tapa esittää kerättyä tietoa, mutta valokuviin liittyvien kuvatekstien muodostamat visualisoinnit nostavat väistämättä sanat merkityksellisempään asemaan kuin varsinaiset kuvat. Tekstintutkija ei tässä välttämättä näe mitään ongelmaa, kuvantutkija kylläkin.

Listalleni päätyi seuraavaksi perinteisempää historiantutkimuksen metodiikkaa kuten keskiajan ja uuden ajan lähdetutkimusta Turun tuomiokirkon Mustasta kirjasta voudintileihin ja Flemingien maakirjoihin. Suuri osa historiantutkijoiden työajasta kuluu edelleen kirjallisen lähdeaineiston analysointiin, eikä sen keskeisyys ole katoamassa. Itselleni kiinnostavaa oli kuulla muun muassa lähdeteoksissa käytetyn paperin vesileima-ajoituksista, joiden perusteella on mahdollista hahmottaa käsikirjojen alkuperäinen kokonaisuus sekä tehdä esimerkiksi melko tarkkoja ajoituksia sen suhteen, milloin jonkin tietyn käsikirjoituksen jokin osa on kirjoitettu tai kuinka monta kirjuria työtä on ollut tekemässä. Toisaalta perinteinen lähdetutkimus voi nykyään kiinnittyä luontevasti digitaaliseen alustaan ja muuntua tietokannaksi, kuten digihumanismin ja perinteikkään historiantutkimuksen ristipaineessa tempoileva voudintilien tutkija aprikoi.

Tässä yhteydessä mainittiin myös itselleni aikaisemmin tuntematon termi ”small big data”, joka viittaa määrällisesti pieneen mutta luonteeltaan ”suureen” dataan, siis eräänlaiseen big datan miniversioon. Puhe big datasta sisältää usein eräänlaisen eeppisen mittasuhteen; määritelläänhän se tyypillisesti valtavista, osin järjestäytymättömistä ja jatkuvasti lisääntyvistä tietomassoista koostuvaksi datamassaksi. Tiedonkeruun kannalta yksittäinen tutkija voi tuntea kauhua määrällisesti valtaisan ja alati laajentuvan tietovarannon kanssa, joten lienee tarpeen pilkkoa käsitettä pienempiin ja paremmin hallittaviin kokonaisuuksiin.

Viimeinen sessio, johon minun oli mahdollista osallistua, käsitteli historiantutkimuksen sähköisiä tutkimusinfrastruktuureja. Esitykset keskittyivät Kansallisarkiston erilaisiin sähköisiin palveluihin, erityisesti digitoitujen karttojen paikkatietojärjestelmän kehittämiseen, heraldisten kokoelmien tietokannan luomiseen ja Suomen keskiajan käsikirjoitusten sähköisen kokoelmatietokannan, Diplomatarium Fennicumin kehittämiseen. Näiden erilaisten sähköisten palvelujen kehittäminen on osa Kansallisarkiston laajempaa tutkimuspalvelustrategiaa, jonka avulla pyritään paremmin vastaamaan erilaisten käyttäjien toiveisiin.

Kuulemieni esitysten perusteella historiantutkimuksen nykytilasta jäi ehkä päällimmäisenä pinnalle digitalisaation haasteet ja sen mukanaan tuomat uudet sovellukset, joita hyödyntämällä tieteenalan on mahdollista suunnata hyvinkin kiinnostaville urille – unohtamatta kuitenkaan perusydintään, lähdekriittistä ja kontekstiherkkää tutkimusotetta.

Historiantutkimuksen päivistä muualla blogosfäärissä:
» Kaisa Kyläkoski: Historiantutkimuksen päivät
» Susanna Ånäs: Olemmeko kaikki historioitsijoita?
» Maria Lähteenmäki: Minne menet historiantutkijoiden ammattikunta tekno-oligarkkien paineen alla?

Lisätietoa:
» SA-kuva-arkisto
» Historiantutkimuksen päivät 2015

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Mitä tutkijat ajattelevat terveys- ja lääketieteen aineistojen arkistoinnista?

Tutkimusaineistojen avoimuus on jo tavallista biotieteissä ja monilla luonnontieteiden aloilla, mutta useilla muilla aloilla avoimuus on harvinaista ja lääketieteessä sitä on hädin tuskin edes harkittu. Tutkimusaineistojen avoimuusvaatimus koskee kuitenkin myös terveys- ja lääketieteitä. Tietoarkisto onkin laajentamassa palveluitaan, jotta myös näiden alojen aineistoille saadaan asianmukaiset käytännöt arkistointiin ja aineistojen jatkokäyttöön.

Kartoittaaksemme tutkijoiden tarpeita, toteutimme toukokuussa 2015 tutkijakyselyn, jossa selvitimme tutkijoiden ajatuksia ja käytäntöjä tutkimusaineistojen jatkohyödyntämisestä. Kysely suunnattiin Tietoarkiston uusille tieteenaloille, humanististen ja lääke- ja terveystieteiden tutkijoille, pois lukien biotieteiden ala. Tässä kirjoituksessani käsittelen terveystieteiden tutkijoiden vastauksia.

Puolet vastaajista oli tietoisia rahoittajien (esim. Suomen Akatemia ja TEKES) ja julkaisijoiden suosituksista ja edellytyksistä avata tutkimusaineistot tiedeyhteisön käyttöön. Tästä huolimatta vain neljäsosa arkistoi aineistonsa omaan yliopistoonsa tai tutkimuslaitokseensa, ja vain neljä prosenttia arkistoi aineistoja erilliseen arkistoimisyksikköön.

Miksi näin harva? Aineistojen jakaminen tutkimusryhmien kesken kun on kuitenkin yleinen käytäntö terveys- ja lääketieteissä.

Osaltaan syynä on väärinymmärrys. Monen tutkijan käsityksen mukaan arkaluonteisia tietoja sisältävää aineistoa ei saa arkistoida muuta tutkimuskäyttöä varten.

Aineiston voi kuitenkin arkistoida, kun siitä ensin poistetaan tunnistetiedot, eli aineisto anonymisoidaan. Mahdollista on myös poistaa aineistosta kaikkein arkaluonteisin osa ja arkistoida vähemmän arkaluonteiset tiedot. Tietoarkistossa anonymisointi ja tutkittavien tietosuojan varmistaminen onkin keskeinen osa arkistointiprosessia.

Tutkijoita huolestuttaa myös se, että ulkopuolinen ei pysty käyttämään aineistoa oikein. Arkistoitava aineisto kuitenkin kuvaillaan Tietoarkistossa niin perin pohjin, että uusi käyttäjä saa tietoonsa miten tiedot on kerätty ja mitä rajoituksia eri muuttujiin liittyy. Tutkija voi myös halutessaan rajata aineiston jatkokäyttöä päättämällä hakemuskohtaisesti, kenelle jatkokäyttölupa myönnetään. Kyselyssä tutkijat toivoivat myös, että heillä olisi oikeus rajata, millainen osa aineistosta hakijalle kulloinkin annetaan.

Tutkittavien informoinnissa ja suostumusten keräämisessä käytetään usein suostumusmallia, jossa tutkittaville kerrotaan aineistoa käytettävän vain yhteen tutkimukseen, ja että tutkimuksen päätyttyä aineisto hävitetään. On myös tavallista kirjoittaa eettisen luvan hakemukseen sen kummemmin asiaa harkitsematta, että aineistoa käytetään vain tähän tutkimukseen ja tutkimuksen loputtua aineisto hävitetään.

Eettiset toimikunnatkin voivat tulkita lakia jyrkemmin kuin lain kirjain vaatii. Eettisen lausunnon saamiseen voi liittyä vaatimuksia aineiston hävittämisestä tai muista rajoituksista. Myös tutkijat itse voivat pitää arkaluonteisen aineiston arkistointia eettisesti arveluttavana, vaikka anonyymin aineiston arkistoinnin sallisi sekä lainsäädäntö että eettinen toimikunta.

Yksi selitys sille, että aineistoja ei juuri arkistoida, on myös se, että tutkijat eivät ole tietoisia arkistointiin ja aineistojen jatkokäyttöön tähtäävästä tutkimuspolitiikasta, eikä muun muassa Tietoarkistoa tai sen palveluita vielä tunneta. Julkaisujen vaatimukset artikkeliin liittyvän tutkimusaineiston avaamisesta ovat jo tutumpia.

Tieto arkistoimisen hyödyistä kuitenkin leviää. Tietoarkistojen ja tutkijoiden välisen yhteistyön lisääntyessä edetään kohti tilannetta, jossa aineistot käytetään hyödyksi tehokkaasti. Tämä säästää tutkimuksessa arvokasta aikaa ja rahaa sekä altistaa tutkittavia vähemmille tutkimuksille.

Lopuksi yhden vastaajan kirjoitus aineistojen jakamisesta: ”Tutkimusryhmämme on jo avannut aineistoja laajasti suomalaisille ja kansainvälisille tutkimusryhmille. Olemme tietojeni mukaan saaneet tiedostojen jakamisesta pelkästään hyötyä ja positiivista palautetta sekä kymmeniä hyviä yhteisjulkaisuja. Tämän lisäksi tutkimus kuuluu kymmeniin kansainvälisiin genetiikan alan konsortiotutkimuksiin, mistä on saatu hyötynä kymmeniä huippujulkaisuja. Aineistojen jakamisesta on hyötyä myös siksi, että vastavuoroisesti meille on auennut mahdollisuus käyttää kansanvälisiä aineistoja, mikä on parantanut mahdollisuuksia julkaisujen hyväksymisestä alan huippulehtiin.

Lisätietoa:
Tutkimusaineistojen avoimen saatavuuden määrittelystä ja asiaan liittyvistä taustatekijöistä voi lukea tarkemmin Tietoarkistolehdessä 2/2014.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan ensimmäinen osa. Ks. toinen osa.