Tag Archives: tutkimusaineistot

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

EU:n tietosuoja-asetus kaventaa tutkimuksen tietosuojan kansallista liikkumavaraa

Lainsäädäntö vaikuttaa olennaisesti siihen, miten lääke- ja terveystieteiden tutkijat pystyvät käyttämään ja jakamaan tutkimusaineistoja. Juuri nyt lakikysymyksestä tekee erityisen ajankohtaisen EU:n uusi tietosuoja-asetus, joka korvaa Suomessakin henkilötietojen käsittelyn yleislakina toimineen henkilötietolain kahden vuoden siirtymäajan jälkeen.

Tietoarkiston ja ATT-hankkeen järjestämä Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa -seminaari kokosi Tampereen yliopistolle joukon tietosuojan ja arkaluontoisten aineistojen tutkimisen asiantuntijoita. 17. maaliskuuta pidetty seminaari keräsi paikalle noin neljäkymmentä osallistujaa, ja lisäksi etäyhteyden kautta mukana oli ainakin sata henkilöä.

Biopankkitoiminta tasapainottaa tutkimuksen ja tutkittavien oikeuksia

Tuorein tutkimusta koskeva suomalainen lainsäädännöllinen uudistus on syksystä 2013 asti voimassa ollut biopankkilaki. Biopankkilakia ja biopankkien käytännön toimintaa Suomessa avasi seminaarin aluksi varatuomari Sirpa Soini Helsingin biopankista.

Soini Kehui Suomen olevan biopankkitoiminnassa kansainvälisesti hyvissä asemissa, koska täällä on pystytty ratkaisemaan sellaisia haasteita, joista monessa muussa maassa edelleen keskustellaan. Biopankkilaki vastaa esimerkiksi siihen, miten vanhat aineistot saadaan tutkimuskäyttöön, ja miten uusile aineistoille hankitaan sellainen laaja suostumus, ettei jokaisen hankkeen kohdalla tarvitse erikseen kysyä, suostuuko tutkittava mukaan vai ei.

Soinin mukaan yksi biopankkitoiminnan keskeisistä tavoitteista on ollut tasapainottaa tutkimuksen ja tutkittavien oikeuksia. Toinen keskeinen pyrkimys on ollut saada tieto ja innovaatiot entistä nopeammin ja tehokkaammin potilaiden ja yhteiskunnan hyödyksi. Soini huomautti yhteiskuntaa hyödyttävän tiedon tuottamisen olevan erityisen olennaista nyt, kun biopankkitoiminta pyörii pitkälti verovaroilla. Tulevaisuuden tavoitteena on saada toimintaan enemmän myös yritysrahoitusta.

Biopankkitutkimus perustuu lähtökohtaisesti suostumukseen

Soini korosti, että biopankkitoiminta perustuu lähtökohtaisesti suostumukseen. Käytännössä tutkittava antaa laajan suostumuksen sille, että biopankki voi käsitellä hänen tietojaan ja luovuttaa niitä tutkimukseen erikseen kyselemättä.

Biopankkeihin on pystytty eettisten toimikuntien lausunnon nojalla siirtämään myös vanhoja aineistoja. Tällöin laajan suostumuksen puutetta on paikattu joko henkilökohtaisella tai julkisella tiedonantomenettelyllä. Lain mukaan vanhat tiedot saa siirtää biopankkiin, jos kukaan ei asiaa nimenomaisesti kiellä. Soini kuitenkin korosti, että kansalaisella on vielä massasiirron jälkeenkin oikeus kysyä, onko hänestä tietoja biopankissa ja halutessaan kieltää tietojen käyttäminen.

Soini huomautti, että vaikka vanhoja näytteitä on pystytty siirtämään biopankkeihin, biopankkilain voimaan astumisen jälkeen kerättyä materiaalia voi biopankittaa vain, jos suostumus on hankittu etukäteen. Hän korostikin, että tutkijan kannattaa jo tutkimussuunnitelman tekovaiheessa miettiä, haluaako hän aineistonsa biopankkiin vai ei.

Aarnio uskoo, että tietosuoja-asetus johtaa biopankkilain avaamiseen

Valitettavasti Soinin jälkeen puheenvuorossa ollut tietosuojavaltuutettu Reijo Aarnio ennusti, että hyvältä kuulostava biopankkilaki saattaa mennä vielä uusiksi. Aarnio uskoo vahvasti, että EU:n tietosuoja-asetus vaikuttaa väkisin niin, että Suomen biopankkilaki joudutaan avaamaan.

Aarnion mielestä asetuksen aikakauteen siirtyminen tarkoittaa kiistatta kysymystä siitä, mikä on Suomen biopankkilain kohtalo, ja mikä asetuksen myötä ylipäänsä on tietosuoja-asioissa Suomen kansallinen liikkumavara.

EU:n tietosuoja-asetuksen keskeinen idea on ihmisen itsemääräämisoikeuden vahvistaminen. Aarnion mukaan tämä tarkoittaa sitä, että biopankkitoiminnan kuten kaiken muunkin henkiötietojen käsittelyn täytyy jatkossa perustua vielä entistä varmemmin luottamukseen. Tämä taas edellyttää hänen tulkintansa mukaan automaattisesti korkeaa tietosuojatasoa.

Aarnio totesi odottavansa, milloin ensimmäinen biopankki toimittaa tietosuojavaltuutetun toimistoon tietotilinpäätöksen, joka todistaa, että biopankki noudattaa toiminnassaan lakia. Velvollisuus tietotilinpäätöksen toimittamiseen on hänen mukaansa yksi niistä asetuksen mukanaan tuomista vaatimuksista, joihin ei kansallisella liikkumavaralla voida vaikuttaa.

Kaiken kaikkiaan Aarnio tuntui pitävän EU:n tietosuoja-asetusta kuitenkin biopankkitoiminnan kannalta positiivisena asiana. Hänen mukaansa yksi asetuksen keskeisistä ideoista on nimittäin harmonisoida lainsäädäntö eurooppalaisella tasolla niin, että esimerkiksi biopankit voisivat jatkossa vaihtaa keskenään tietoja yhden lainsäädännön puitteissa.

Kaikki terveyteen liittyvä tieto on terveystietoa

Päivän suurimmat tunteet tuntui herättävän Sarecon informaatio-oikeudellisen asiantuntijan Marjut Salokanteleen esitys siitä, millä eri tavoilla EU:n tietosuoja-asetus käytännössä vaikuttaa terveystietojen tutkimiseen. Salokannel korosti, että terveystietojen tutkimuskäytössä tulee ottaa huomioon se, että niistä on EU:n asetuksessa säädetty hieman tiukemmin kuin henkilötietojen tutkimuskäytöstä ylipäätään.

Terveystiedoksi tulkitaan Salokanteleen mukaan käytännössä kaikki mahdollinen terveyteen liittyvä tieto. Selkeä asetuksen tuoma uudistus on se, että nyt myös geenitiedot ja biologiset näytteet on määritelty erikseen terveystiedoiksi. Suomen näkökulmasta uutta on myös henkilötunnuksen status: jatkossa tunnusta käsitellään automaattisesti terveystietona aina, kun se liittyy terveydellisiin tietoihin.

Salokannel korosti, että myös koodatut tai kryptatut tiedot ovat henkilötietoja riippumatta siitä, missä koodiavain sijaitsee, jos se vain on olemassa jossain päin maailmaa. Näin ollen myös pseudonyymit terveystiedot ovat arkaluontoisia, mikä tarkoittaa, että lähtökohtaisesti niitä ei saa käsitellä.

Anonymisoitu tieto sen sijaan ei ole henkilötietoa eikä näin ollen arkaluontoista. Asetuksen mukaan tiedon voi tulkita anonymisoiduksi silloin, kun sitä ei enää kohtuudella voida palauttaa yksittäiseen henkilöön.

Yleisö haastoikin Salokanteleen kiivaasti perustelemaan, millä perusteilla pseudonyymin tiedon palauttaminen yksittäiseen henkilöön tulkitaan kohtuudella mahdolliseksi silloin, kun koodiavain sijaistee esimerkiksi kassakaapissa toisella puolella maapalloa. Salokannel kuitenkin piti tiukasti kiinni vallitsevasta lain tulkinnasta. Toisaalta hän korosti, että myös arkaluonteisten tietojen tutkiminen on käytännössä mahdollista, ensisijaisesti tutkittavan vapaaehtoisen suostumuksen perusteella.

Asetus määrittelee tieteellisen tutkimuksen laajasti

EU:n tietosuoja-asetus on Salokanteleen mukaan tutkimuksen kannalta positiivinen ainakin siinä mielessä, että tieteellinen tutkimus on asetuksessa määritelty laajasti: määritelmä sisältää sekä teknologisen kehitystyön, perustutkimuksen, soveltavan tutkimuksen että yksityisesti rahoitetun tutkimuksen ja lisäksi kansanterveyden alueella liikkuvat, julkista etua palvelevat selvitykset.

Kliinisissä kokeissa syntyvien aineistojen jatkotutkimuskäyttö vaatii Salokanteleen mukaan uuden asetuksen aikakaudella aina erillisen, alkuperäisen suostumuksen yhteydessä annetun jatkokäyttösuostumuksen. Suostumus vaaditaan myös siihen, jos halutaan yhdistää toisiinsa esimerkiksi rekisteritietoja ja kliinisistä kokeista syntyneitä henkilötietoja.

Vireillä laki SOTE-tietojen toissijaisesta käytöstä

Suomalaisen tutkimuksen kannalta olennainen tulossa oleva uudistus on EU:n asetuksen lisäksi myös valmisteluvaiheessa oleva sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskeva lainsäädäntö. THL:n tietovarantopalveluiden kehittämispäällikkö, lainsäädäntötyöryhmän sihteeri Arto Vuori käytti oman puheenvuoronsa näiden suunnitelmien avaamiseen.

Suunnitteilla on useita lääke- ja terveystieteellisen tutkimuksen näkökulmasta positiivisia muutoksia. Selvää hyötyä toisi ainakin potilastiedon arkiston avaaminen tutkimuskäyttöön, käsittelyperusteiden selvempi sääntely sekä toissijaisen käytön kannalta keskeisten luovutussäännösten yhdenmukaistaminen ja yksinkertaistaminen. Viimeksi mainittu uudistus johtaisi ainakin ihannetapauksessa siihen, että aineistojen käyttölupien saaminen ja tietoluovutukset nopeutuisivat ja toimitusvarmuus paranisi.

Vireillä on myös kunnianhimoinen palveluoperaattorimalli, jonka tavoitteena on, että tutkija voisi tulevaisuudessa saada eri rekisteriaineistoja yhdellä aineistopyynnöllä yhden luukun kautta.

Tietosuojalain tulkinta tuntuu tutkijan näkökulmasta kohtuuttomalta

Päivän päättävässä paneelikeskustellussa THL:n tutkimusprofessori Mika Gissler ja Helsingin yliopiston ravitsemustieteen professori Mikael Fogelholm pääsivät vielä keskustelemaan tietosuojakysymyksistä tutkijan näkökulmasta sekä Marjut Salokanteleen että yleisön kanssa.

Gissler harmitteli, että tietosuojalain tulkinta on Suomessa jatkuvasti tiukentunut ja sen seurauksena rekisteritutkimuksen lupaprosessit ovat hankaloituneet. Hän toivoikin, että esimerkiksi Vuoren väläyttämä yhden luukun malli helpottaisi tulevaisuudessa kohtuuttomiksi venyneitä lupaprosesseja.

Gissler oletti, että EU:n tietosuoja-asetus ratkaisee osan rekisteritutkimuksen kansainvälisistä ongelmista, mutta huomautti, että esimerkiksi Yhdysvaltojen ja eurooppalaisen lainsäädännön väliset ongelmat pysyvät myös uuden asetuksen aikana.

Hän myös huomautti, että jos Suomi haluaa säilyttää mahdollisuuden julkaista arvostetuissa tiedelehdissä, on keksittävä keino, joilla myös terveys- ja lääketieteen aineistojen avaaminen on tulevaisuudessa jollain tapaa mahdollista.

Mikael Fogelholmin alustuksessa korostui erityisesti ajatus siitä, että olisi eettistä ottaa tutkittavilta kerätty tieto yhteiskunnassa mahdollisimman laajaan hyötykäyttöön. Hänen näkemyksensä olikin se, että kaikki yritykset estää ihmisiltä kerätyn datan mahdollisimman tehokas käyttäminen on epäeettistä toimintaa.

Lisäksi Fogelholm ilmaisi huolensa siitä, että etenkään pitkissä, monitieteisissä kohorttitutkimuksissa tutkijat eivät voi aineiston keruuvaiheessa tietää tarkasti, mistä kaikista näkökulmista tulevat vuosien saatossa aineistoa tutkimaan, minkä vuoksi tutkittavilta on käytännössä mahdotonta saada etukäteen suostumusta kaikkiin lopullisiin tutkimusaiheisiin. Fogelholm on törmännyt ongelmaan esimerkiksi tehdessään Päijäthäme Ikihyvä -tutkimusta, jossa on yli kymmenen vuoden ajan tutkittu vanhenemista hyvin monitieteisellä otteella.

Salokannel ja yleisössä ollut Tietosuojavaltuutetun toimiston ylitarkastaja Anna Hänninen lohduttivat Fogelholmia toteamalla, ettei suostumuksen tarvitse olla yksityiskohtainen. Riittää, että lopullinen käyttötarkoitus ei ole yhteensopimaton tutkittaville ilmoitetun käyttötarkoituksen kanssa. Salokannel huomautti, että informed consentia voi nykyteknologian avulla myös myöhemmin tarkentaa erilaisten tietokoneohjelmien välityksellä.

Kaiken kaikkiaan päivästä jäi varmuus ainakin siitä, että tietosuojaa koskeva lainsäädäntö tulee tulevaisuudessakin ohjaamaan vahvasti sitä, miten terveys- ja lääketieteen aineistoja voi tutkimuksessa käyttää ja jakaa. Toisaalta vireillä on myös paljon kehitysideoita, joiden ansiosta tulevaisuus voi kaikesta huolimatta olla paljon nykyhetkeä valoisampi.

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

EU:n tietosuoja-asetus kaventaa tutkimuksen tietosuojan kansallista liikkumavaraa

Lainsäädäntö vaikuttaa olennaisesti siihen, miten lääke- ja terveystieteiden tutkijat pystyvät käyttämään ja jakamaan tutkimusaineistoja. Juuri nyt lakikysymyksestä tekee erityisen ajankohtaisen EU:n uusi tietosuoja-asetus, joka korvaa Suomessakin henkilötietojen käsittelyn yleislakina toimineen henkilötietolain kahden vuoden siirtymäajan jälkeen.

Tietoarkiston ja ATT-hankkeen järjestämä Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa -seminaari kokosi Tampereen yliopistolle joukon tietosuojan ja arkaluontoisten aineistojen tutkimisen asiantuntijoita. 17. maaliskuuta pidetty seminaari keräsi paikalle noin neljäkymmentä osallistujaa, ja lisäksi etäyhteyden kautta mukana oli ainakin sata henkilöä.

Biopankkitoiminta tasapainottaa tutkimuksen ja tutkittavien oikeuksia

Tuorein tutkimusta koskeva suomalainen lainsäädännöllinen uudistus on syksystä 2013 asti voimassa ollut biopankkilaki. Biopankkilakia ja biopankkien käytännön toimintaa Suomessa avasi seminaarin aluksi varatuomari Sirpa Soini Helsingin biopankista.

Soini Kehui Suomen olevan biopankkitoiminnassa kansainvälisesti hyvissä asemissa, koska täällä on pystytty ratkaisemaan sellaisia haasteita, joista monessa muussa maassa edelleen keskustellaan. Biopankkilaki vastaa esimerkiksi siihen, miten vanhat aineistot saadaan tutkimuskäyttöön, ja miten uusile aineistoille hankitaan sellainen laaja suostumus, ettei jokaisen hankkeen kohdalla tarvitse erikseen kysyä, suostuuko tutkittava mukaan vai ei.

Soinin mukaan yksi biopankkitoiminnan keskeisistä tavoitteista on ollut tasapainottaa tutkimuksen ja tutkittavien oikeuksia. Toinen keskeinen pyrkimys on ollut saada tieto ja innovaatiot entistä nopeammin ja tehokkaammin potilaiden ja yhteiskunnan hyödyksi. Soini huomautti yhteiskuntaa hyödyttävän tiedon tuottamisen olevan erityisen olennaista nyt, kun biopankkitoiminta pyörii pitkälti verovaroilla. Tulevaisuuden tavoitteena on saada toimintaan enemmän myös yritysrahoitusta.

Biopankkitutkimus perustuu lähtökohtaisesti suostumukseen

Soini korosti, että biopankkitoiminta perustuu lähtökohtaisesti suostumukseen. Käytännössä tutkittava antaa laajan suostumuksen sille, että biopankki voi käsitellä hänen tietojaan ja luovuttaa niitä tutkimukseen erikseen kyselemättä.

Biopankkeihin on pystytty eettisten toimikuntien lausunnon nojalla siirtämään myös vanhoja aineistoja. Tällöin laajan suostumuksen puutetta on paikattu joko henkilökohtaisella tai julkisella tiedonantomenettelyllä. Lain mukaan vanhat tiedot saa siirtää biopankkiin, jos kukaan ei asiaa nimenomaisesti kiellä. Soini kuitenkin korosti, että kansalaisella on vielä massasiirron jälkeenkin oikeus kysyä, onko hänestä tietoja biopankissa ja halutessaan kieltää tietojen käyttäminen.

Soini huomautti, että vaikka vanhoja näytteitä on pystytty siirtämään biopankkeihin, biopankkilain voimaan astumisen jälkeen kerättyä materiaalia voi biopankittaa vain, jos suostumus on hankittu etukäteen. Hän korostikin, että tutkijan kannattaa jo tutkimussuunnitelman tekovaiheessa miettiä, haluaako hän aineistonsa biopankkiin vai ei.

Aarnio uskoo, että tietosuoja-asetus johtaa biopankkilain avaamiseen

Valitettavasti Soinin jälkeen puheenvuorossa ollut tietosuojavaltuutettu Reijo Aarnio ennusti, että hyvältä kuulostava biopankkilaki saattaa mennä vielä uusiksi. Aarnio uskoo vahvasti, että EU:n tietosuoja-asetus vaikuttaa väkisin niin, että Suomen biopankkilaki joudutaan avaamaan.

Aarnion mielestä asetuksen aikakauteen siirtyminen tarkoittaa kiistatta kysymystä siitä, mikä on Suomen biopankkilain kohtalo, ja mikä asetuksen myötä ylipäänsä on tietosuoja-asioissa Suomen kansallinen liikkumavara.

EU:n tietosuoja-asetuksen keskeinen idea on ihmisen itsemääräämisoikeuden vahvistaminen. Aarnion mukaan tämä tarkoittaa sitä, että biopankkitoiminnan kuten kaiken muunkin henkiötietojen käsittelyn täytyy jatkossa perustua vielä entistä varmemmin luottamukseen. Tämä taas edellyttää hänen tulkintansa mukaan automaattisesti korkeaa tietosuojatasoa.

Aarnio totesi odottavansa, milloin ensimmäinen biopankki toimittaa tietosuojavaltuutetun toimistoon tietotilinpäätöksen, joka todistaa, että biopankki noudattaa toiminnassaan lakia. Velvollisuus tietotilinpäätöksen toimittamiseen on hänen mukaansa yksi niistä asetuksen mukanaan tuomista vaatimuksista, joihin ei kansallisella liikkumavaralla voida vaikuttaa.

Kaiken kaikkiaan Aarnio tuntui pitävän EU:n tietosuoja-asetusta kuitenkin biopankkitoiminnan kannalta positiivisena asiana. Hänen mukaansa yksi asetuksen keskeisistä ideoista on nimittäin harmonisoida lainsäädäntö eurooppalaisella tasolla niin, että esimerkiksi biopankit voisivat jatkossa vaihtaa keskenään tietoja yhden lainsäädännön puitteissa.

Kaikki terveyteen liittyvä tieto on terveystietoa

Päivän suurimmat tunteet tuntui herättävän Sarecon informaatio-oikeudellisen asiantuntijan Marjut Salokanteleen esitys siitä, millä eri tavoilla EU:n tietosuoja-asetus käytännössä vaikuttaa terveystietojen tutkimiseen. Salokannel korosti, että terveystietojen tutkimuskäytössä tulee ottaa huomioon se, että niistä on EU:n asetuksessa säädetty hieman tiukemmin kuin henkilötietojen tutkimuskäytöstä ylipäätään.

Terveystiedoksi tulkitaan Salokanteleen mukaan käytännössä kaikki mahdollinen terveyteen liittyvä tieto. Selkeä asetuksen tuoma uudistus on se, että nyt myös geenitiedot ja biologiset näytteet on määritelty erikseen terveystiedoiksi. Suomen näkökulmasta uutta on myös henkilötunnuksen status: jatkossa tunnusta käsitellään automaattisesti terveystietona aina, kun se liittyy terveydellisiin tietoihin.

Salokannel korosti, että myös koodatut tai kryptatut tiedot ovat henkilötietoja riippumatta siitä, missä koodiavain sijaitsee, jos se vain on olemassa jossain päin maailmaa. Näin ollen myös pseudonyymit terveystiedot ovat arkaluontoisia, mikä tarkoittaa, että lähtökohtaisesti niitä ei saa käsitellä.

Anonymisoitu tieto sen sijaan ei ole henkilötietoa eikä näin ollen arkaluontoista. Asetuksen mukaan tiedon voi tulkita anonymisoiduksi silloin, kun sitä ei enää kohtuudella voida palauttaa yksittäiseen henkilöön.

Yleisö haastoikin Salokanteleen kiivaasti perustelemaan, millä perusteilla pseudonyymin tiedon palauttaminen yksittäiseen henkilöön tulkitaan kohtuudella mahdolliseksi silloin, kun koodiavain sijaistee esimerkiksi kassakaapissa toisella puolella maapalloa. Salokannel kuitenkin piti tiukasti kiinni vallitsevasta lain tulkinnasta. Toisaalta hän korosti, että myös arkaluonteisten tietojen tutkiminen on käytännössä mahdollista, ensisijaisesti tutkittavan vapaaehtoisen suostumuksen perusteella.

Asetus määrittelee tieteellisen tutkimuksen laajasti

EU:n tietosuoja-asetus on Salokanteleen mukaan tutkimuksen kannalta positiivinen ainakin siinä mielessä, että tieteellinen tutkimus on asetuksessa määritelty laajasti: määritelmä sisältää sekä teknologisen kehitystyön, perustutkimuksen, soveltavan tutkimuksen että yksityisesti rahoitetun tutkimuksen ja lisäksi kansanterveyden alueella liikkuvat, julkista etua palvelevat selvitykset.

Kliinisissä kokeissa syntyvien aineistojen jatkotutkimuskäyttö vaatii Salokanteleen mukaan uuden asetuksen aikakaudella aina erillisen, alkuperäisen suostumuksen yhteydessä annetun jatkokäyttösuostumuksen. Suostumus vaaditaan myös siihen, jos halutaan yhdistää toisiinsa esimerkiksi rekisteritietoja ja kliinisistä kokeista syntyneitä henkilötietoja.

Vireillä laki SOTE-tietojen toissijaisesta käytöstä

Suomalaisen tutkimuksen kannalta olennainen tulossa oleva uudistus on EU:n asetuksen lisäksi myös valmisteluvaiheessa oleva sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskeva lainsäädäntö. THL:n tietovarantopalveluiden kehittämispäällikkö, lainsäädäntötyöryhmän sihteeri Arto Vuori käytti oman puheenvuoronsa näiden suunnitelmien avaamiseen.

Suunnitteilla on useita lääke- ja terveystieteellisen tutkimuksen näkökulmasta positiivisia muutoksia. Selvää hyötyä toisi ainakin potilastiedon arkiston avaaminen tutkimuskäyttöön, käsittelyperusteiden selvempi sääntely sekä toissijaisen käytön kannalta keskeisten luovutussäännösten yhdenmukaistaminen ja yksinkertaistaminen. Viimeksi mainittu uudistus johtaisi ainakin ihannetapauksessa siihen, että aineistojen käyttölupien saaminen ja tietoluovutukset nopeutuisivat ja toimitusvarmuus paranisi.

Vireillä on myös kunnianhimoinen palveluoperaattorimalli, jonka tavoitteena on, että tutkija voisi tulevaisuudessa saada eri rekisteriaineistoja yhdellä aineistopyynnöllä yhden luukun kautta.

Tietosuojalain tulkinta tuntuu tutkijan näkökulmasta kohtuuttomalta

Päivän päättävässä paneelikeskustellussa THL:n tutkimusprofessori Mika Gissler ja Helsingin yliopiston ravitsemustieteen professori Mikael Fogelholm pääsivät vielä keskustelemaan tietosuojakysymyksistä tutkijan näkökulmasta sekä Marjut Salokanteleen että yleisön kanssa.

Gissler harmitteli, että tietosuojalain tulkinta on Suomessa jatkuvasti tiukentunut ja sen seurauksena rekisteritutkimuksen lupaprosessit ovat hankaloituneet. Hän toivoikin, että esimerkiksi Vuoren väläyttämä yhden luukun malli helpottaisi tulevaisuudessa kohtuuttomiksi venyneitä lupaprosesseja.

Gissler oletti, että EU:n tietosuoja-asetus ratkaisee osan rekisteritutkimuksen kansainvälisistä ongelmista, mutta huomautti, että esimerkiksi Yhdysvaltojen ja eurooppalaisen lainsäädännön väliset ongelmat pysyvät myös uuden asetuksen aikana.

Hän myös huomautti, että jos Suomi haluaa säilyttää mahdollisuuden julkaista arvostetuissa tiedelehdissä, on keksittävä keino, joilla myös terveys- ja lääketieteen aineistojen avaaminen on tulevaisuudessa jollain tapaa mahdollista.

Mikael Fogelholmin alustuksessa korostui erityisesti ajatus siitä, että olisi eettistä ottaa tutkittavilta kerätty tieto yhteiskunnassa mahdollisimman laajaan hyötykäyttöön. Hänen näkemyksensä olikin se, että kaikki yritykset estää ihmisiltä kerätyn datan mahdollisimman tehokas käyttäminen on epäeettistä toimintaa.

Lisäksi Fogelholm ilmaisi huolensa siitä, että etenkään pitkissä, monitieteisissä kohorttitutkimuksissa tutkijat eivät voi aineiston keruuvaiheessa tietää tarkasti, mistä kaikista näkökulmista tulevat vuosien saatossa aineistoa tutkimaan, minkä vuoksi tutkittavilta on käytännössä mahdotonta saada etukäteen suostumusta kaikkiin lopullisiin tutkimusaiheisiin. Fogelholm on törmännyt ongelmaan esimerkiksi tehdessään Päijäthäme Ikihyvä -tutkimusta, jossa on yli kymmenen vuoden ajan tutkittu vanhenemista hyvin monitieteisellä otteella.

Salokannel ja yleisössä ollut Tietosuojavaltuutetun toimiston ylitarkastaja Anna Hänninen lohduttivat Fogelholmia toteamalla, ettei suostumuksen tarvitse olla yksityiskohtainen. Riittää, että lopullinen käyttötarkoitus ei ole yhteensopimaton tutkittaville ilmoitetun käyttötarkoituksen kanssa. Salokannel huomautti, että informed consentia voi nykyteknologian avulla myös myöhemmin tarkentaa erilaisten tietokoneohjelmien välityksellä.

Kaiken kaikkiaan päivästä jäi varmuus ainakin siitä, että tietosuojaa koskeva lainsäädäntö tulee tulevaisuudessakin ohjaamaan vahvasti sitä, miten terveys- ja lääketieteen aineistoja voi tutkimuksessa käyttää ja jakaa. Toisaalta vireillä on myös paljon kehitysideoita, joiden ansiosta tulevaisuus voi kaikesta huolimatta olla paljon nykyhetkeä valoisampi.

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Terveystietoja sisältävien tutkimusaineistojen arkistointi – tutkija vaatimusten ristitulessa

Suomalaiset tutkijat keräävät valtavasti tietoa ihmisistä ja ihmisten käyttäytymisestä. Lisäksi terveysalan viranomaiset ja tutkimuslaitokset keräävät lakisääteisesti mittavia tietovarantoja väestön palveluiden käytöstä ja terveydentilasta. Kerätty tieto olisi lääketieteen, kansanterveyden ja yhteiskunnan kannalta erinomaista, mutta sitä ei voida käyttää täysimääräisesti hyväksi.

Ongelmat johtuvat osittain tiukasta henkilötietolaista ja sen tulkinnasta, joka estää täysin biopankkilain ulkopuolelle jäävien tutkimusaineistojen arkistoimisen tunnisteellisena. Osittain kyse on siitä, että tutkittavien suostumus ja eettisen toimikunnan lausunto on tapana pyytää sellaisessa muodossa, että ne mahdollistavat aineiston käytön vain kyseiseen tutkimukseen.

Rekisteritietojen saatavuuskin on vaikeaa. Rekisteriaineistojen tietoteknisestä turvallisuudesta on huolehdittu, mutta aineistoja ei ole järjestelmällisesti kuvailtu, eikä niitä pysty hakemaan yksinkertaisesti. Hakuprosessit vievät pahimmillaan vuosia, ja aineiston käytöstä joutuu maksamaan jopa tuhansia euroja. Saadut aineistot ovat raakadataa, joka voi vaatia huomattavan paljon työstämistä ennen kuin aineisto on käyttökelpoista tutkimukseen.

Samaan aikaan kansalliset ja kansainväliset rahoittajat suosittelevat tai edellyttävät tutkimusaineistojen avaamista. Tieteelliset julkaisut voivat pitää tutkimusaineiston avaamista jopa julkaisun ehtona. Tutkijan taas täytyisi saada pitää aineistonsa itsellään, kunnes on saanut oman tutkimustuloksensa julkaistua.

Hankkeeseen saa rahoitusta, jos pystyy osoittamaan, että käytössä on tutkimusongelmaan sopiva aineisto. Aineiston käyttöön saaminen kuitenkin vaatii huomattavaa rahallista panostusta, mikä on ongelma siinä vaiheessa kun rahoitusta ollaan vasta hakemassa. Lisäksi tutkimusrahoitus on määräaikaista. Mitä tehdä, jos kolmen vuoden tutkimusrahoituskaudesta kaksi vuotta kuluu eettisten lausuntojen, aineistonkäyttölupien ja lopulta itse aineistojen saamiseen?

Ongelmiin on onneksi havahduttu. Tutkimuksen asema tulee toivon mukaan parantumaan EU:n tietosuoja-asetuksen myötä (1). Myös SOTE-tiedon toissijaisen käytön lainsäädäntö (2) tulee helpottamaan aineistojen saamista tutkimukseen. Kansallinen palveluoperaattori (3) on aikanaan toteutuessaan yhden luukun palvelu, josta tutkija voi etsiä tietoa olemassa olevista aineistoista, hakea niihin käyttölupaa, hankkia eettisen lausunnon ja lopulta saada aineiston käyttöönsä kohtuullisessa ajassa. Kaikkein arkaluonteisinta tietoa varten suunnitellaan etäkäyttöjärjestelmää, jossa aineiston pääsisi analysoimaan vaarantamatta tutkittavien tietosuojaa.

Rekisteriviranomaisista avoimuuden edelläkävijä on THL, joka on jo parantamassa aineistojensa näkyvyyttä ja helpottamassa tutkijoiden luvanhakua ja aineistonsaantia. Organisaation uusi datapolitiikka on luettavissa THL:n sivuilla.

Tietoarkisto osallistuu yhteisen tavoitteen saavuttamiseen tarjoamalla kerätyille tutkimusaineistoille luotettavan säilytyspaikan sekä helpon palveluportaalin, Ailan. Ailassa tutkija voi selata olemassa olevia aineistoja ja tutkia niiden keräystapaa ja sisältöä aineistokuvailun perusteella. Kun sopiva aineisto löytyy, sen saa parhaimmillaan käyttöönsä heti. Kaikkein tiukimman käyttöluokituksen aineistoissakin Tietoarkisto hoitaa käyttölupapyynnön aineiston haltijalle ja toimittaa aineiston heti, kun lupa on saatu.

Tulevaisuus näyttää siis onneksi nykyhetkeä kirkkaammalta.

1http://ec.europa.eu/justice/data-protection/reform/index_en.htm
2https://www.innokyla.fi/web/verkosto1598477
3http://www.sitra.fi/hankkeet/isaacus-esituotantohankkeet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan viimeinen osa. Ks. ensimmäinen ja toinen osa.

Terveystietoja sisältävien tutkimusaineistojen arkistointi – tutkija vaatimusten ristitulessa

Suomalaiset tutkijat keräävät valtavasti tietoa ihmisistä ja ihmisten käyttäytymisestä. Lisäksi terveysalan viranomaiset ja tutkimuslaitokset keräävät lakisääteisesti mittavia tietovarantoja väestön palveluiden käytöstä ja terveydentilasta. Kerätty tieto olisi lääketieteen, kansanterveyden ja yhteiskunnan kannalta erinomaista, mutta sitä ei voida käyttää täysimääräisesti hyväksi.

Ongelmat johtuvat osittain tiukasta henkilötietolaista ja sen tulkinnasta, joka estää täysin biopankkilain ulkopuolelle jäävien tutkimusaineistojen arkistoimisen tunnisteellisena. Osittain kyse on siitä, että tutkittavien suostumus ja eettisen toimikunnan lausunto on tapana pyytää sellaisessa muodossa, että ne mahdollistavat aineiston käytön vain kyseiseen tutkimukseen.

Rekisteritietojen saatavuuskin on vaikeaa. Rekisteriaineistojen tietoteknisestä turvallisuudesta on huolehdittu, mutta aineistoja ei ole järjestelmällisesti kuvailtu, eikä niitä pysty hakemaan yksinkertaisesti. Hakuprosessit vievät pahimmillaan vuosia, ja aineiston käytöstä joutuu maksamaan jopa tuhansia euroja. Saadut aineistot ovat raakadataa, joka voi vaatia huomattavan paljon työstämistä ennen kuin aineisto on käyttökelpoista tutkimukseen.

Samaan aikaan kansalliset ja kansainväliset rahoittajat suosittelevat tai edellyttävät tutkimusaineistojen avaamista. Tieteelliset julkaisut voivat pitää tutkimusaineiston avaamista jopa julkaisun ehtona. Tutkijan taas täytyisi saada pitää aineistonsa itsellään, kunnes on saanut oman tutkimustuloksensa julkaistua.

Hankkeeseen saa rahoitusta, jos pystyy osoittamaan, että käytössä on tutkimusongelmaan sopiva aineisto. Aineiston käyttöön saaminen kuitenkin vaatii huomattavaa rahallista panostusta, mikä on ongelma siinä vaiheessa kun rahoitusta ollaan vasta hakemassa. Lisäksi tutkimusrahoitus on määräaikaista. Mitä tehdä, jos kolmen vuoden tutkimusrahoituskaudesta kaksi vuotta kuluu eettisten lausuntojen, aineistonkäyttölupien ja lopulta itse aineistojen saamiseen?

Ongelmiin on onneksi havahduttu. Tutkimuksen asema tulee toivon mukaan parantumaan EU:n tietosuoja-asetuksen myötä (1). Myös SOTE-tiedon toissijaisen käytön lainsäädäntö (2) tulee helpottamaan aineistojen saamista tutkimukseen. Kansallinen palveluoperaattori (3) on aikanaan toteutuessaan yhden luukun palvelu, josta tutkija voi etsiä tietoa olemassa olevista aineistoista, hakea niihin käyttölupaa, hankkia eettisen lausunnon ja lopulta saada aineiston käyttöönsä kohtuullisessa ajassa. Kaikkein arkaluonteisinta tietoa varten suunnitellaan etäkäyttöjärjestelmää, jossa aineiston pääsisi analysoimaan vaarantamatta tutkittavien tietosuojaa.

Rekisteriviranomaisista avoimuuden edelläkävijä on THL, joka on jo parantamassa aineistojensa näkyvyyttä ja helpottamassa tutkijoiden luvanhakua ja aineistonsaantia. Organisaation uusi datapolitiikka on luettavissa THL:n sivuilla.

Tietoarkisto osallistuu yhteisen tavoitteen saavuttamiseen tarjoamalla kerätyille tutkimusaineistoille luotettavan säilytyspaikan sekä helpon palveluportaalin, Ailan. Ailassa tutkija voi selata olemassa olevia aineistoja ja tutkia niiden keräystapaa ja sisältöä aineistokuvailun perusteella. Kun sopiva aineisto löytyy, sen saa parhaimmillaan käyttöönsä heti. Kaikkein tiukimman käyttöluokituksen aineistoissakin Tietoarkisto hoitaa käyttölupapyynnön aineiston haltijalle ja toimittaa aineiston heti, kun lupa on saatu.

Tulevaisuus näyttää siis onneksi nykyhetkeä kirkkaammalta.

1http://ec.europa.eu/justice/data-protection/reform/index_en.htm
2https://www.innokyla.fi/web/verkosto1598477
3http://www.sitra.fi/hankkeet/isaacus-esituotantohankkeet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan viimeinen osa. Ks. ensimmäinen ja toinen osa.

Tietoarkisto vei Länsi-Balkaniin osaamista laadullisten aineistojen arkistoinnista

Sain tilaisuuden vierailla Sloveniassa Ljubljanassa laadullisten aineistojen arkisto-osaajan roolissa. Kolmipäiväisen työpajan (9.–11.2.2016) tavoitteena oli perehtyä tutkimusaineistojen arkistointiin. Esitysten ohessa työpajassa käsiteltiin oikeita aineistoja, jotka on tuotettu RRPP-projektissa.

Työpajan osallistujat olivat Albaniasta, Kosovosta, Serbiasta, Makedoniasta, Montenegrosta ja Kroatiasta. Aineistojen kotimaat ja kielet olivat samat kuin osallistujien. Kouluttajia oli minun lisäkseni Slovenian ja Sveitsin tietoarkistoista.

Se että laadulliset aineistot olivat vieraskielisiä, tuotti omat pulmansa niistä keskustelemiseen. Apuna toimi Google-kääntäjä, jonka avulla minun oli mahdollista kurkistella erikielisten aineistojen sisältöihin myös englanniksi jo ennen työpajaa. Koneellisesti tuotetut pikakäännökset ovat tietysti epätarkkoja ja osin virheellisiä. Ne kuitenkin auttoivat oleellisesti arkistointia koskevissa keskusteluissa. Analyysiin Google-kääntäjällä tuotetut aineistot tuskin sopisivat täysin varauksitta.

Kulttuuriset ja historialliset erityispiirteet puolestaan tuovat eri maiden laadullisiin aineistoihin omat eettiset ja lainsäädännöllisetkin haasteensa. Etukäteen oletin, että niistä keskusteltaisiin eniten. Mutta toisin kävi. Olennaisimmat kysymykset arkistoinnin näkökulmasta olivat samat kuin meillä Suomessa: Onko aineistojen sisältämistä henkilöistä ja aineiston tuottamistilanteista riittävästi tietoa? Ovatko haastattelujen kysymykset tai ryhmäkeskustelujen teemat tallessa? Ovatko litteraatit yhdenmukaisia läpi koko aineiston? Mitä aineistojen käytöstä ja erityisesti jatkokäytöstä on sovittu tutkittavien kanssa? Miten laadullista aineistoa voi anonymisoida?

Niin Länsi-Balkanilla kuin meillä Suomessakin laadullisen aineiston arkistointi onnistuu parhaiten, kun ajatus aineiston säilyttämisestä jatkokäyttöä varten on ollut tutkijalla mielessä alusta saakka. Vaikka työpajassa käsiteltyjen aineistojen joukossa oli muutama tällainen valopilkku, harmillisen usein aineistoista puuttuivat tiedot tutkittavien suostumuksesta. Keskusteluissamme tulimme siihen tulokseen, että kirjallisten suostumusten ohella tai niiden sijaan olisi hyvä saada äänitallenteiden alkuun tallennetuksi tutkijan selostus aineiston käytöstä ja säilyttämisestä ja tutkittavien suostumus osallistua annetuin ehdoin. Näin tutkimussuostumukset olisivat mukana itse aineistotiedostoissa ja niistä tehdyissä litteraateissa.

Toisinaan tutkijalla oli kadonnut alkuperäinen haastattelurunko, ja muutamista aineistoista puuttui osa, kun tiedostoja oli hävinnyt tutkijan työkoneen vaihtamisen yhteydessä. Tällaiset riskit ovat mahdollisia kaikilla tutkijoilla maasta riippumatta. Olinkin iloinen voidessani esitellä Tietoarkiston aineistonhallinnan käsikirjaa, josta suurin osa on käännetty myös englanniksi.

Työpajan osallistujat suunnittelevat perustavansa tietoarkistoja omiin kotimaihinsa. Jo karttuneen tietotaidon saavutettavuus auttaa heitä siinä huomattavasti. CESSDA-arkistoista laadullisten aineistojen ylivertaisia osaajia ovat Ison-Britannian UKDA ja pienen Suomen Tietoarkisto.

Lisätietoa:
» SEEDS workshop in Ljubljana
» Aineistonhallinnan käsikirja
» Data Management Guidelines

Arja Kuula-Luumi
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkisto vei Länsi-Balkaniin osaamista laadullisten aineistojen arkistoinnista

Sain tilaisuuden vierailla Sloveniassa Ljubljanassa laadullisten aineistojen arkisto-osaajan roolissa. Kolmipäiväisen työpajan (9.–11.2.2016) tavoitteena oli perehtyä tutkimusaineistojen arkistointiin. Esitysten ohessa työpajassa käsiteltiin oikeita aineistoja, jotka on tuotettu RRPP-projektissa.

Työpajan osallistujat olivat Albaniasta, Kosovosta, Serbiasta, Makedoniasta, Montenegrosta ja Kroatiasta. Aineistojen kotimaat ja kielet olivat samat kuin osallistujien. Kouluttajia oli minun lisäkseni Slovenian ja Sveitsin tietoarkistoista.

Se että laadulliset aineistot olivat vieraskielisiä, tuotti omat pulmansa niistä keskustelemiseen. Apuna toimi Google-kääntäjä, jonka avulla minun oli mahdollista kurkistella erikielisten aineistojen sisältöihin myös englanniksi jo ennen työpajaa. Koneellisesti tuotetut pikakäännökset ovat tietysti epätarkkoja ja osin virheellisiä. Ne kuitenkin auttoivat oleellisesti arkistointia koskevissa keskusteluissa. Analyysiin Google-kääntäjällä tuotetut aineistot tuskin sopisivat täysin varauksitta.

Kulttuuriset ja historialliset erityispiirteet puolestaan tuovat eri maiden laadullisiin aineistoihin omat eettiset ja lainsäädännöllisetkin haasteensa. Etukäteen oletin, että niistä keskusteltaisiin eniten. Mutta toisin kävi. Olennaisimmat kysymykset arkistoinnin näkökulmasta olivat samat kuin meillä Suomessa: Onko aineistojen sisältämistä henkilöistä ja aineiston tuottamistilanteista riittävästi tietoa? Ovatko haastattelujen kysymykset tai ryhmäkeskustelujen teemat tallessa? Ovatko litteraatit yhdenmukaisia läpi koko aineiston? Mitä aineistojen käytöstä ja erityisesti jatkokäytöstä on sovittu tutkittavien kanssa? Miten laadullista aineistoa voi anonymisoida?

Niin Länsi-Balkanilla kuin meillä Suomessakin laadullisen aineiston arkistointi onnistuu parhaiten, kun ajatus aineiston säilyttämisestä jatkokäyttöä varten on ollut tutkijalla mielessä alusta saakka. Vaikka työpajassa käsiteltyjen aineistojen joukossa oli muutama tällainen valopilkku, harmillisen usein aineistoista puuttuivat tiedot tutkittavien suostumuksesta. Keskusteluissamme tulimme siihen tulokseen, että kirjallisten suostumusten ohella tai niiden sijaan olisi hyvä saada äänitallenteiden alkuun tallennetuksi tutkijan selostus aineiston käytöstä ja säilyttämisestä ja tutkittavien suostumus osallistua annetuin ehdoin. Näin tutkimussuostumukset olisivat mukana itse aineistotiedostoissa ja niistä tehdyissä litteraateissa.

Toisinaan tutkijalla oli kadonnut alkuperäinen haastattelurunko, ja muutamista aineistoista puuttui osa, kun tiedostoja oli hävinnyt tutkijan työkoneen vaihtamisen yhteydessä. Tällaiset riskit ovat mahdollisia kaikilla tutkijoilla maasta riippumatta. Olinkin iloinen voidessani esitellä Tietoarkiston aineistonhallinnan käsikirjaa, josta suurin osa on käännetty myös englanniksi.

Työpajan osallistujat suunnittelevat perustavansa tietoarkistoja omiin kotimaihinsa. Jo karttuneen tietotaidon saavutettavuus auttaa heitä siinä huomattavasti. CESSDA-arkistoista laadullisten aineistojen ylivertaisia osaajia ovat Ison-Britannian UKDA ja pienen Suomen Tietoarkisto.

Lisätietoa:
» SEEDS workshop in Ljubljana
» Aineistonhallinnan käsikirja
» Data Management Guidelines

Arja Kuula-Luumi
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi