Tag Archives: arkistoinnin esteet

Sosiaalisen median ja internetin aineistot – mitä voin arkistoida Tietoarkistoon?

Tietoarkistolta kysytään säännöllisin väliajoin voiko sosiaalisen median aineistoja ja erilaisia verkkoaineistoja arkistoida jatkokäyttöä varten. Sosiaalisen median ja verkon aineistot ovat varsin monimuotoisia, kuten niitä hyödyntävä tutkimuskin. Usein tutkijan onkin tarpeen eritellä, millaista aineistoa on keräämässä ja millaisilta alustoilta. Arkistointimahdollisuus riippuu nimittäin pitkälti siitä, tutkiiko verkkokeskusteluja, organisaatioiden nettisivuja vai esimerkiksi nettiblogeja. Lisäksi kysymykseen vaikuttavat muun muassa tekijänoikeuteen ja tietosuojaan liittyvät seikat. Asia ei siis ole yksinkertainen, mutta ei onneksi mahdotonkaan.

Aineistoista haasteellisimman kokonaisuuden muodostavat sosiaalisen median aineistot. Somedataa on yleensä mahdollista kerätä eri sosiaalisen median alustoilta ja käyttää tutkimustarkoituksiin. Ongelmaksi kuitenkin nousee aineistojen arkistointi ja jatkokäyttö, jota sosiaalisen median alustojen liiketoimintamalli ei pääsääntöisesti salli. Esimerkiksi Facebook, LinkedIn ja Google omistavat oikeuden ostaa ja myydä käyttäjiensä tuottamaa sisältöä, ja pidättävät siten sen omistusoikeuden. Käytännössä alustat haluavat siis ensisijaisesti hyödyntää käyttäjädataa itse, eivätkä antaa sitä kolmansille osapuolille jatkohyödynnettäväksi. Muun muassa tästä syystä sosiaalisen median aineistojen arkistointi jatkokäyttöä varten esimerkiksi Tietoarkistoon ei ole mahdollista.

Myös muualta verkosta kerätyissä aineistoissa on arkistoinnin näkökulmasta muutamia rajoitteita. Yksityisten henkilöiden välinen viestintä, joka tapahtuu keskustelupalstoilla, blogeissa tai muissa vastaavissa ei ole arkistoitavissa. Näin on etenkin sellaisissa tapauksissa, kun palstalle tai blogiin pääsy vaatii kirjautumisen. Arkistointi on yleensä mahdotonta myös silloin, kun verkkosivuilla on sisältöä, johon sivun ylläpitäjällä ei ole oikeuksia. Käytännössä tämä tarkoittaa esimerkiksi sivustoja, joiden sisältö on otettu jostain muualta tai sisällön ovat tuottaneet jotkut muut kuin sivuston ylläpitäjä. Asiaa monimutkaistaa vielä se, että kaikkien verkkosivujen kohdalla ei aina ole selvää, kenellä on tekijänoikeus sisältöön. Epäselvissä tapauksissa asiasta kannattaa aina kysyä sivuston ylläpitäjältä.

Vaikka rajoitteet saattavat aluksi tuntua lannistavilta, verkossa on runsaasti aineistoja, joita voi arkistoida jatkokäyttöön. Tietoarkiston ja Kopioston välinen sopimus mahdollistaa erilaisten verkkosisältöjen keräämisen ja arkistoimisen sivustoilta, jotka eivät edellytä kirjautumista tai lisenssin hankkimista. Jos kuva- tai tekstiaineisto on kerätty kaikille avoimilta nettisivuilta, esimerkiksi julkisten organisaatioiden sivuilta, sen voi arkistoida Tietoarkistoon. Tämä pätee myös yleisiin blogiteksteihin kuten lehtien ylläpitämiin tai muutoin toimitettuihin blogeihin. Kannattaa kuitenkin muistaa, että arkistoida saa vain varsinaisia blogitekstejä, ei mahdollista kommenttiosiota, jossa yksityishenkilöt viestivät keskenään.

Tietoarkistoon on mahdollista arkistoida myös sellaista verkkosivuilta kerättyä tekstiä, joka on lisensoitu CC-lisenssillä eli Creative Commons -lisenssillä. Tällä lisenssillä teoksen tekijä voi jakaa tekijänoikeuslain suomia yksinoikeuksia muille. Yleisin lisenssi on CC BY, jonka mukaisesti lisensoitua teosta ja sen pohjalta tehtyjä muokattuja versioita saa kopioida, levittää, näyttää ja esittää julkisesti. Lisäksi lisensoidun tekstiaineiston arkistointi edellyttää luvan pyytämistä tekijältä.

Verkko- ja someaineistoja keräävä tutkija voikin siis noudattaa peukalosääntönä seuraavaa:

Tietoarkistoon on mahdollista arkistoida

  • Vapaasti kaikkien saatavilla olevien verkkosivujen kuva- ja tekstiaineistoja
  • Yleisiä blogitekstejä kuten lehtien ylläpitämiä ja toimitettuja blogeja
  • CC-lisensoituja kuva- ja tekstiaineistoja verkkosivuilla, jos arkistointiin saa luvan tekijältä

Tietoarkistoon ei ole mahdollista arkistoida

  • Sosiaalisen median dataa
  • Yksityisten henkilöiden välistä viestintää keskustelupalstoilla, blogeissa tai muissa vastaavissa
  • Verkkosivustoilta kopioitua sisältöä silloin, kun osa sivusta on muualta otettua tai muiden tekemää sisältöä, joiden oikeuksien haltija ei ole verkkosivun ylläpitäjä

Lisäksi kannattaa muistaa, että AllerMedian ja Kielipankin sopimuksen mukaisesti Suomi24-aineistojen käyttö on mahdollista Kielipankin kautta. Kielipankin kautta on käytettävissä myös Helsingin Sanomien kotimaan uutisia ja niiden kommentteja sisältävä aineisto.

Mikäli et ohjeistuksesta huolimatta ole varma, soveltuuko aineistosi arkistoitavaksi, ota suoraan yhteyttä Tietoarkiston asiakaspalveluun ja kysy neuvoa!

Lisätietoa:
» Tietoarkiston asiakaspalvelu: asiakaspalvelu.fsd at uta.fi
» Kielipankki
» Tietoarkistolehti (45, 2/2016): Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Tietoarkisto vei Länsi-Balkaniin osaamista laadullisten aineistojen arkistoinnista

Sain tilaisuuden vierailla Sloveniassa Ljubljanassa laadullisten aineistojen arkisto-osaajan roolissa. Kolmipäiväisen työpajan (9.–11.2.2016) tavoitteena oli perehtyä tutkimusaineistojen arkistointiin. Esitysten ohessa työpajassa käsiteltiin oikeita aineistoja, jotka on tuotettu RRPP-projektissa.

Työpajan osallistujat olivat Albaniasta, Kosovosta, Serbiasta, Makedoniasta, Montenegrosta ja Kroatiasta. Aineistojen kotimaat ja kielet olivat samat kuin osallistujien. Kouluttajia oli minun lisäkseni Slovenian ja Sveitsin tietoarkistoista.

Se että laadulliset aineistot olivat vieraskielisiä, tuotti omat pulmansa niistä keskustelemiseen. Apuna toimi Google-kääntäjä, jonka avulla minun oli mahdollista kurkistella erikielisten aineistojen sisältöihin myös englanniksi jo ennen työpajaa. Koneellisesti tuotetut pikakäännökset ovat tietysti epätarkkoja ja osin virheellisiä. Ne kuitenkin auttoivat oleellisesti arkistointia koskevissa keskusteluissa. Analyysiin Google-kääntäjällä tuotetut aineistot tuskin sopisivat täysin varauksitta.

Kulttuuriset ja historialliset erityispiirteet puolestaan tuovat eri maiden laadullisiin aineistoihin omat eettiset ja lainsäädännöllisetkin haasteensa. Etukäteen oletin, että niistä keskusteltaisiin eniten. Mutta toisin kävi. Olennaisimmat kysymykset arkistoinnin näkökulmasta olivat samat kuin meillä Suomessa: Onko aineistojen sisältämistä henkilöistä ja aineiston tuottamistilanteista riittävästi tietoa? Ovatko haastattelujen kysymykset tai ryhmäkeskustelujen teemat tallessa? Ovatko litteraatit yhdenmukaisia läpi koko aineiston? Mitä aineistojen käytöstä ja erityisesti jatkokäytöstä on sovittu tutkittavien kanssa? Miten laadullista aineistoa voi anonymisoida?

Niin Länsi-Balkanilla kuin meillä Suomessakin laadullisen aineiston arkistointi onnistuu parhaiten, kun ajatus aineiston säilyttämisestä jatkokäyttöä varten on ollut tutkijalla mielessä alusta saakka. Vaikka työpajassa käsiteltyjen aineistojen joukossa oli muutama tällainen valopilkku, harmillisen usein aineistoista puuttuivat tiedot tutkittavien suostumuksesta. Keskusteluissamme tulimme siihen tulokseen, että kirjallisten suostumusten ohella tai niiden sijaan olisi hyvä saada äänitallenteiden alkuun tallennetuksi tutkijan selostus aineiston käytöstä ja säilyttämisestä ja tutkittavien suostumus osallistua annetuin ehdoin. Näin tutkimussuostumukset olisivat mukana itse aineistotiedostoissa ja niistä tehdyissä litteraateissa.

Toisinaan tutkijalla oli kadonnut alkuperäinen haastattelurunko, ja muutamista aineistoista puuttui osa, kun tiedostoja oli hävinnyt tutkijan työkoneen vaihtamisen yhteydessä. Tällaiset riskit ovat mahdollisia kaikilla tutkijoilla maasta riippumatta. Olinkin iloinen voidessani esitellä Tietoarkiston aineistonhallinnan käsikirjaa, josta suurin osa on käännetty myös englanniksi.

Työpajan osallistujat suunnittelevat perustavansa tietoarkistoja omiin kotimaihinsa. Jo karttuneen tietotaidon saavutettavuus auttaa heitä siinä huomattavasti. CESSDA-arkistoista laadullisten aineistojen ylivertaisia osaajia ovat Ison-Britannian UKDA ja pienen Suomen Tietoarkisto.

Lisätietoa:
» SEEDS workshop in Ljubljana
» Aineistonhallinnan käsikirja
» Data Management Guidelines

Arja Kuula-Luumi
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkisto vei Länsi-Balkaniin osaamista laadullisten aineistojen arkistoinnista

Sain tilaisuuden vierailla Sloveniassa Ljubljanassa laadullisten aineistojen arkisto-osaajan roolissa. Kolmipäiväisen työpajan (9.–11.2.2016) tavoitteena oli perehtyä tutkimusaineistojen arkistointiin. Esitysten ohessa työpajassa käsiteltiin oikeita aineistoja, jotka on tuotettu RRPP-projektissa.

Työpajan osallistujat olivat Albaniasta, Kosovosta, Serbiasta, Makedoniasta, Montenegrosta ja Kroatiasta. Aineistojen kotimaat ja kielet olivat samat kuin osallistujien. Kouluttajia oli minun lisäkseni Slovenian ja Sveitsin tietoarkistoista.

Se että laadulliset aineistot olivat vieraskielisiä, tuotti omat pulmansa niistä keskustelemiseen. Apuna toimi Google-kääntäjä, jonka avulla minun oli mahdollista kurkistella erikielisten aineistojen sisältöihin myös englanniksi jo ennen työpajaa. Koneellisesti tuotetut pikakäännökset ovat tietysti epätarkkoja ja osin virheellisiä. Ne kuitenkin auttoivat oleellisesti arkistointia koskevissa keskusteluissa. Analyysiin Google-kääntäjällä tuotetut aineistot tuskin sopisivat täysin varauksitta.

Kulttuuriset ja historialliset erityispiirteet puolestaan tuovat eri maiden laadullisiin aineistoihin omat eettiset ja lainsäädännöllisetkin haasteensa. Etukäteen oletin, että niistä keskusteltaisiin eniten. Mutta toisin kävi. Olennaisimmat kysymykset arkistoinnin näkökulmasta olivat samat kuin meillä Suomessa: Onko aineistojen sisältämistä henkilöistä ja aineiston tuottamistilanteista riittävästi tietoa? Ovatko haastattelujen kysymykset tai ryhmäkeskustelujen teemat tallessa? Ovatko litteraatit yhdenmukaisia läpi koko aineiston? Mitä aineistojen käytöstä ja erityisesti jatkokäytöstä on sovittu tutkittavien kanssa? Miten laadullista aineistoa voi anonymisoida?

Niin Länsi-Balkanilla kuin meillä Suomessakin laadullisen aineiston arkistointi onnistuu parhaiten, kun ajatus aineiston säilyttämisestä jatkokäyttöä varten on ollut tutkijalla mielessä alusta saakka. Vaikka työpajassa käsiteltyjen aineistojen joukossa oli muutama tällainen valopilkku, harmillisen usein aineistoista puuttuivat tiedot tutkittavien suostumuksesta. Keskusteluissamme tulimme siihen tulokseen, että kirjallisten suostumusten ohella tai niiden sijaan olisi hyvä saada äänitallenteiden alkuun tallennetuksi tutkijan selostus aineiston käytöstä ja säilyttämisestä ja tutkittavien suostumus osallistua annetuin ehdoin. Näin tutkimussuostumukset olisivat mukana itse aineistotiedostoissa ja niistä tehdyissä litteraateissa.

Toisinaan tutkijalla oli kadonnut alkuperäinen haastattelurunko, ja muutamista aineistoista puuttui osa, kun tiedostoja oli hävinnyt tutkijan työkoneen vaihtamisen yhteydessä. Tällaiset riskit ovat mahdollisia kaikilla tutkijoilla maasta riippumatta. Olinkin iloinen voidessani esitellä Tietoarkiston aineistonhallinnan käsikirjaa, josta suurin osa on käännetty myös englanniksi.

Työpajan osallistujat suunnittelevat perustavansa tietoarkistoja omiin kotimaihinsa. Jo karttuneen tietotaidon saavutettavuus auttaa heitä siinä huomattavasti. CESSDA-arkistoista laadullisten aineistojen ylivertaisia osaajia ovat Ison-Britannian UKDA ja pienen Suomen Tietoarkisto.

Lisätietoa:
» SEEDS workshop in Ljubljana
» Aineistonhallinnan käsikirja
» Data Management Guidelines

Arja Kuula-Luumi
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Mitä tutkijat ajattelevat terveys- ja lääketieteen aineistojen arkistoinnista?

Tutkimusaineistojen avoimuus on jo tavallista biotieteissä ja monilla luonnontieteiden aloilla, mutta useilla muilla aloilla avoimuus on harvinaista ja lääketieteessä sitä on hädin tuskin edes harkittu. Tutkimusaineistojen avoimuusvaatimus koskee kuitenkin myös terveys- ja lääketieteitä. Tietoarkisto onkin laajentamassa palveluitaan, jotta myös näiden alojen aineistoille saadaan asianmukaiset käytännöt arkistointiin ja aineistojen jatkokäyttöön.

Kartoittaaksemme tutkijoiden tarpeita, toteutimme toukokuussa 2015 tutkijakyselyn, jossa selvitimme tutkijoiden ajatuksia ja käytäntöjä tutkimusaineistojen jatkohyödyntämisestä. Kysely suunnattiin Tietoarkiston uusille tieteenaloille, humanististen ja lääke- ja terveystieteiden tutkijoille, pois lukien biotieteiden ala. Tässä kirjoituksessani käsittelen terveystieteiden tutkijoiden vastauksia.

Puolet vastaajista oli tietoisia rahoittajien (esim. Suomen Akatemia ja TEKES) ja julkaisijoiden suosituksista ja edellytyksistä avata tutkimusaineistot tiedeyhteisön käyttöön. Tästä huolimatta vain neljäsosa arkistoi aineistonsa omaan yliopistoonsa tai tutkimuslaitokseensa, ja vain neljä prosenttia arkistoi aineistoja erilliseen arkistoimisyksikköön.

Miksi näin harva? Aineistojen jakaminen tutkimusryhmien kesken kun on kuitenkin yleinen käytäntö terveys- ja lääketieteissä.

Osaltaan syynä on väärinymmärrys. Monen tutkijan käsityksen mukaan arkaluonteisia tietoja sisältävää aineistoa ei saa arkistoida muuta tutkimuskäyttöä varten.

Aineiston voi kuitenkin arkistoida, kun siitä ensin poistetaan tunnistetiedot, eli aineisto anonymisoidaan. Mahdollista on myös poistaa aineistosta kaikkein arkaluonteisin osa ja arkistoida vähemmän arkaluonteiset tiedot. Tietoarkistossa anonymisointi ja tutkittavien tietosuojan varmistaminen onkin keskeinen osa arkistointiprosessia.

Tutkijoita huolestuttaa myös se, että ulkopuolinen ei pysty käyttämään aineistoa oikein. Arkistoitava aineisto kuitenkin kuvaillaan Tietoarkistossa niin perin pohjin, että uusi käyttäjä saa tietoonsa miten tiedot on kerätty ja mitä rajoituksia eri muuttujiin liittyy. Tutkija voi myös halutessaan rajata aineiston jatkokäyttöä päättämällä hakemuskohtaisesti, kenelle jatkokäyttölupa myönnetään. Kyselyssä tutkijat toivoivat myös, että heillä olisi oikeus rajata, millainen osa aineistosta hakijalle kulloinkin annetaan.

Tutkittavien informoinnissa ja suostumusten keräämisessä käytetään usein suostumusmallia, jossa tutkittaville kerrotaan aineistoa käytettävän vain yhteen tutkimukseen, ja että tutkimuksen päätyttyä aineisto hävitetään. On myös tavallista kirjoittaa eettisen luvan hakemukseen sen kummemmin asiaa harkitsematta, että aineistoa käytetään vain tähän tutkimukseen ja tutkimuksen loputtua aineisto hävitetään.

Eettiset toimikunnatkin voivat tulkita lakia jyrkemmin kuin lain kirjain vaatii. Eettisen lausunnon saamiseen voi liittyä vaatimuksia aineiston hävittämisestä tai muista rajoituksista. Myös tutkijat itse voivat pitää arkaluonteisen aineiston arkistointia eettisesti arveluttavana, vaikka anonyymin aineiston arkistoinnin sallisi sekä lainsäädäntö että eettinen toimikunta.

Yksi selitys sille, että aineistoja ei juuri arkistoida, on myös se, että tutkijat eivät ole tietoisia arkistointiin ja aineistojen jatkokäyttöön tähtäävästä tutkimuspolitiikasta, eikä muun muassa Tietoarkistoa tai sen palveluita vielä tunneta. Julkaisujen vaatimukset artikkeliin liittyvän tutkimusaineiston avaamisesta ovat jo tutumpia.

Tieto arkistoimisen hyödyistä kuitenkin leviää. Tietoarkistojen ja tutkijoiden välisen yhteistyön lisääntyessä edetään kohti tilannetta, jossa aineistot käytetään hyödyksi tehokkaasti. Tämä säästää tutkimuksessa arvokasta aikaa ja rahaa sekä altistaa tutkittavia vähemmille tutkimuksille.

Lopuksi yhden vastaajan kirjoitus aineistojen jakamisesta: ”Tutkimusryhmämme on jo avannut aineistoja laajasti suomalaisille ja kansainvälisille tutkimusryhmille. Olemme tietojeni mukaan saaneet tiedostojen jakamisesta pelkästään hyötyä ja positiivista palautetta sekä kymmeniä hyviä yhteisjulkaisuja. Tämän lisäksi tutkimus kuuluu kymmeniin kansainvälisiin genetiikan alan konsortiotutkimuksiin, mistä on saatu hyötynä kymmeniä huippujulkaisuja. Aineistojen jakamisesta on hyötyä myös siksi, että vastavuoroisesti meille on auennut mahdollisuus käyttää kansanvälisiä aineistoja, mikä on parantanut mahdollisuuksia julkaisujen hyväksymisestä alan huippulehtiin.

Lisätietoa:
Tutkimusaineistojen avoimen saatavuuden määrittelystä ja asiaan liittyvistä taustatekijöistä voi lukea tarkemmin Tietoarkistolehdessä 2/2014.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan ensimmäinen osa. Ks. toinen osa.

Mitä tutkijat ajattelevat terveys- ja lääketieteen aineistojen arkistoinnista?

Tutkimusaineistojen avoimuus on jo tavallista biotieteissä ja monilla luonnontieteiden aloilla, mutta useilla muilla aloilla avoimuus on harvinaista ja lääketieteessä sitä on hädin tuskin edes harkittu. Tutkimusaineistojen avoimuusvaatimus koskee kuitenkin myös terveys- ja lääketieteitä. Tietoarkisto onkin laajentamassa palveluitaan, jotta myös näiden alojen aineistoille saadaan asianmukaiset käytännöt arkistointiin ja aineistojen jatkokäyttöön.

Kartoittaaksemme tutkijoiden tarpeita, toteutimme toukokuussa 2015 tutkijakyselyn, jossa selvitimme tutkijoiden ajatuksia ja käytäntöjä tutkimusaineistojen jatkohyödyntämisestä. Kysely suunnattiin Tietoarkiston uusille tieteenaloille, humanististen ja lääke- ja terveystieteiden tutkijoille, pois lukien biotieteiden ala. Tässä kirjoituksessani käsittelen terveystieteiden tutkijoiden vastauksia.

Puolet vastaajista oli tietoisia rahoittajien (esim. Suomen Akatemia ja TEKES) ja julkaisijoiden suosituksista ja edellytyksistä avata tutkimusaineistot tiedeyhteisön käyttöön. Tästä huolimatta vain neljäsosa arkistoi aineistonsa omaan yliopistoonsa tai tutkimuslaitokseensa, ja vain neljä prosenttia arkistoi aineistoja erilliseen arkistoimisyksikköön.

Miksi näin harva? Aineistojen jakaminen tutkimusryhmien kesken kun on kuitenkin yleinen käytäntö terveys- ja lääketieteissä.

Osaltaan syynä on väärinymmärrys. Monen tutkijan käsityksen mukaan arkaluonteisia tietoja sisältävää aineistoa ei saa arkistoida muuta tutkimuskäyttöä varten.

Aineiston voi kuitenkin arkistoida, kun siitä ensin poistetaan tunnistetiedot, eli aineisto anonymisoidaan. Mahdollista on myös poistaa aineistosta kaikkein arkaluonteisin osa ja arkistoida vähemmän arkaluonteiset tiedot. Tietoarkistossa anonymisointi ja tutkittavien tietosuojan varmistaminen onkin keskeinen osa arkistointiprosessia.

Tutkijoita huolestuttaa myös se, että ulkopuolinen ei pysty käyttämään aineistoa oikein. Arkistoitava aineisto kuitenkin kuvaillaan Tietoarkistossa niin perin pohjin, että uusi käyttäjä saa tietoonsa miten tiedot on kerätty ja mitä rajoituksia eri muuttujiin liittyy. Tutkija voi myös halutessaan rajata aineiston jatkokäyttöä päättämällä hakemuskohtaisesti, kenelle jatkokäyttölupa myönnetään. Kyselyssä tutkijat toivoivat myös, että heillä olisi oikeus rajata, millainen osa aineistosta hakijalle kulloinkin annetaan.

Tutkittavien informoinnissa ja suostumusten keräämisessä käytetään usein suostumusmallia, jossa tutkittaville kerrotaan aineistoa käytettävän vain yhteen tutkimukseen, ja että tutkimuksen päätyttyä aineisto hävitetään. On myös tavallista kirjoittaa eettisen luvan hakemukseen sen kummemmin asiaa harkitsematta, että aineistoa käytetään vain tähän tutkimukseen ja tutkimuksen loputtua aineisto hävitetään.

Eettiset toimikunnatkin voivat tulkita lakia jyrkemmin kuin lain kirjain vaatii. Eettisen lausunnon saamiseen voi liittyä vaatimuksia aineiston hävittämisestä tai muista rajoituksista. Myös tutkijat itse voivat pitää arkaluonteisen aineiston arkistointia eettisesti arveluttavana, vaikka anonyymin aineiston arkistoinnin sallisi sekä lainsäädäntö että eettinen toimikunta.

Yksi selitys sille, että aineistoja ei juuri arkistoida, on myös se, että tutkijat eivät ole tietoisia arkistointiin ja aineistojen jatkokäyttöön tähtäävästä tutkimuspolitiikasta, eikä muun muassa Tietoarkistoa tai sen palveluita vielä tunneta. Julkaisujen vaatimukset artikkeliin liittyvän tutkimusaineiston avaamisesta ovat jo tutumpia.

Tieto arkistoimisen hyödyistä kuitenkin leviää. Tietoarkistojen ja tutkijoiden välisen yhteistyön lisääntyessä edetään kohti tilannetta, jossa aineistot käytetään hyödyksi tehokkaasti. Tämä säästää tutkimuksessa arvokasta aikaa ja rahaa sekä altistaa tutkittavia vähemmille tutkimuksille.

Lopuksi yhden vastaajan kirjoitus aineistojen jakamisesta: ”Tutkimusryhmämme on jo avannut aineistoja laajasti suomalaisille ja kansainvälisille tutkimusryhmille. Olemme tietojeni mukaan saaneet tiedostojen jakamisesta pelkästään hyötyä ja positiivista palautetta sekä kymmeniä hyviä yhteisjulkaisuja. Tämän lisäksi tutkimus kuuluu kymmeniin kansainvälisiin genetiikan alan konsortiotutkimuksiin, mistä on saatu hyötynä kymmeniä huippujulkaisuja. Aineistojen jakamisesta on hyötyä myös siksi, että vastavuoroisesti meille on auennut mahdollisuus käyttää kansanvälisiä aineistoja, mikä on parantanut mahdollisuuksia julkaisujen hyväksymisestä alan huippulehtiin.

Lisätietoa:
Tutkimusaineistojen avoimen saatavuuden määrittelystä ja asiaan liittyvistä taustatekijöistä voi lukea tarkemmin Tietoarkistolehdessä 2/2014.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan ensimmäinen osa. Ks. toinen osa.

Laadulliset aineistot saivat IASSIST-konferenssissa aiempaa enemmän huomiota

IASSIST (International Association of Social Science Information Service & Technology) on yhteiskuntatieteellistä tutkimusta tukevien yksiköiden, kuten tietoarkistojen ja datakirjastojen, työntekijöiden kansainvälinen järjestö. Sen tärkein toimintamuoto on vuosittain järjestettävä kansainvälinen konferenssi. Tänä vuonna konferenssi järjestettiin Yhdysvaltojen Minneapolisissa kesäkuun ensimmäisellä viikolla. Konferenssiin osallistui myös neljä tietoarkistolaista.

Neljä päivää kestänyt konferenssi tarjosi runsaasti kiinnostavia aihepiiriin liittyviä luentoja ja työpajoja. Työpajat oli sijoitettu tapahtuman ensimmäiselle päivälle tiistaille. Loput kolme päivää oli pyhitetty luennoille ja paneelikeskusteluille. Kymmenestä valittavana olleesta työpajasta osallistuin itse kahteen, jotka molemmat liittyivät laadullisten aineistojen käsittelyyn. Perinteisesti laadulliset aineistot ovat saaneet IASSIST-konferensseissa selvästi kvantitatiivisia sisariaan vähemmän näkyvyyttä, joten kaksi erityisesti kvalitatiivisiin aineistoihin keskittyvää työpajaa olivat tervetullut uudistus.

Työpajoista ensimmäisessä tutustuttiin laadullisten aineistojen analysointityökaluun NVivoon (Using NVivo 10 for Qualitative Data Analysis). Vaikka työkalun perusajatus olikin monelle osallistujalle jo ennestään tuttu, sai kurssilta hyviä vinkkejä NVivon erilaisista käyttömahdollisuuksista. Työpajassa NVivoa lähestyttiin nimenomaan käytännön tasolla. Jokainen osallistuja sai koodata testiaineistoja ja kokeilla ohjelman tarjoamia työkaluja aineistojen analysoinnin helpottamiseksi.

Toinen työpaja käsitteli laadullisten aineistojen arkistoinnin ja jatkokäytön erityispiirteitä (Managing and Sharing Qualitative Data). Tutun aihepiirin teki työpajassa kiinnostavaksi muun muassa se, että sen järjesti yhdysvaltalaiseen Syracusen yliopistoon vasta hiljattain perustettu laadullisten arkistointiin erikoistunut Qualitative Data Repository (QDR).

Työpajan keskusteluissa sain huomata, että laadullisten aineistojen arkistoimisen haasteet ovat samoja maasta ja maanosasta riippumatta. Nämä haasteet liittyvät usein esimerkiksi tutkimuseettisiin ja tekijänoikeuskysymyksiin, arkistointia hankaloittavaan lainsäädäntöön sekä tutkijoiden haluttomuuteen luovuttaa keräämänsä, ja usein kovin henkilökohtaisina pitämänsä, tutkimusaineistot jatkokäyttöön. Kävikin varsin selväksi, että niin esimerkiksi Yhdysvaltojen, Euroopan kuin Afrikankin data-arkistoissa arkistotyöntekijät saavat vakuutella aineistoja kerääviä tutkijoita arkistoinnin hyödyistä ja hälventää aineistojen arkistointiin liittyviä epäluuloja.

Positiivisena muutoksena työpajan osallistujat kertoivat havainneensa sen, että kun aikaisemmin tutkijat tulivat ensimmäisen kerran kysymään arkistointiin liittyviä neuvoja vasta aineistot kerättyään, ottavat he nykyään arkistointimahdollisuuden huomioon yhä useammin jo aineistonhallintasuunnitelmaa laatiessaan. Tämä mahdollistaa sen, että tutkittavilta voidaan pyytää asianmukainen suostumus aineiston arkistointiin jo aineistoa kerättäessä.

IASSISTin varsinaiset luentosessiot oli jaettu teemansa perusteella kolmeen eri ryhmään. Tämä auttoi runsaudenpulasta kärsiviä konferenssiosallistujia valitsemaan monista päällekkäisistä sessioista itselle sopivimmat sen perusteella, kiinnostivatko häntä aineistonhallintaan liittyvät kysymykset, aineistopalvelujen ammatillinen kehittäminen vai datainfrastruktuuri ja -sovellukset. Itse osallistuin pääasiassa kahden ensimmäisen ryhmän luentosessioihin.

Luennot vahvistivat jo työpajassa tekemääni havaintoa siitä, että tutkimusaineistojen arkistointiin liittyvät kysymykset ovat pitkälti samanlaisia maasta ja arkistosta riippumatta. IASSIST tarjoaakin hienon tilaisuuden keskustella yhteisistä haasteista ja kehityssuunnista eri maista tulevien saman alan asiantuntijoiden kanssa. Samalla se tarjoaa vuosittain hyvän katsauksen siitä, mihin suuntaan eri maiden data-arkistot ovat kehittäneet toimintaansa ja palvelujansa edellisen vuoden aikana.

Ammatillisen verkostoitumismahdollisuuden lisäämiseksi IASSIST-konferenssiin kuuluu myös vapaamuotoisempaa ohjelmaa, kuten perinteinen ensimmäisen konferenssipäivän iltavastaanotto. Tällä kertaa vastaanotto järjestettiin Frank Gehryn suunnittelemassa upeassa Weisman Art Museumissa. Vastaanoton ohella perinteisesti yksi IASSISTin odotetuimpia tilaisuuksia varsinaisen konferenssiohjelman ulkopuolella on torstai-illan juhlaillallinen, jossa kansainvälisiä arkistokuulumisia voi vaihtaa hyvän ruoan ja juoman parissa.

IASSIST tarjosi siis jälleen kerran kattavan paketin tutkimusaineistojen arkistointiin ja jatkokäyttöön liittyviä näkökulmia. Seuraavan kerran IASSIST järjestetään Norjan Bergenissä touko-kesäkuun vaihteessa vuonna 2016. Osallistumista voin suositella kaikille tutkimusaineistojen arkistoinnin parissa työskenteleville, tieteenalaan katsomatta.

Lisätietoa:
» IASSIST
» IASSIST 2015 -konferenssi
» NVivo
» Qualitative Data Repository

Jarkko Päivärinta
tietopalveluasiantuntija
etunimi.sukunimi [at] uta.fi

Laadulliset aineistot saivat IASSIST-konferenssissa aiempaa enemmän huomiota

IASSIST (International Association of Social Science Information Service & Technology) on yhteiskuntatieteellistä tutkimusta tukevien yksiköiden, kuten tietoarkistojen ja datakirjastojen, työntekijöiden kansainvälinen järjestö. Sen tärkein toimintamuoto on vuosittain järjestettävä kansainvälinen konferenssi. Tänä vuonna konferenssi järjestettiin Yhdysvaltojen Minneapolisissa kesäkuun ensimmäisellä viikolla. Konferenssiin osallistui myös neljä tietoarkistolaista.

Neljä päivää kestänyt konferenssi tarjosi runsaasti kiinnostavia aihepiiriin liittyviä luentoja ja työpajoja. Työpajat oli sijoitettu tapahtuman ensimmäiselle päivälle tiistaille. Loput kolme päivää oli pyhitetty luennoille ja paneelikeskusteluille. Kymmenestä valittavana olleesta työpajasta osallistuin itse kahteen, jotka molemmat liittyivät laadullisten aineistojen käsittelyyn. Perinteisesti laadulliset aineistot ovat saaneet IASSIST-konferensseissa selvästi kvantitatiivisia sisariaan vähemmän näkyvyyttä, joten kaksi erityisesti kvalitatiivisiin aineistoihin keskittyvää työpajaa olivat tervetullut uudistus.

Työpajoista ensimmäisessä tutustuttiin laadullisten aineistojen analysointityökaluun NVivoon (Using NVivo 10 for Qualitative Data Analysis). Vaikka työkalun perusajatus olikin monelle osallistujalle jo ennestään tuttu, sai kurssilta hyviä vinkkejä NVivon erilaisista käyttömahdollisuuksista. Työpajassa NVivoa lähestyttiin nimenomaan käytännön tasolla. Jokainen osallistuja sai koodata testiaineistoja ja kokeilla ohjelman tarjoamia työkaluja aineistojen analysoinnin helpottamiseksi.

Toinen työpaja käsitteli laadullisten aineistojen arkistoinnin ja jatkokäytön erityispiirteitä (Managing and Sharing Qualitative Data). Tutun aihepiirin teki työpajassa kiinnostavaksi muun muassa se, että sen järjesti yhdysvaltalaiseen Syracusen yliopistoon vasta hiljattain perustettu laadullisten arkistointiin erikoistunut Qualitative Data Repository (QDR).

Työpajan keskusteluissa sain huomata, että laadullisten aineistojen arkistoimisen haasteet ovat samoja maasta ja maanosasta riippumatta. Nämä haasteet liittyvät usein esimerkiksi tutkimuseettisiin ja tekijänoikeuskysymyksiin, arkistointia hankaloittavaan lainsäädäntöön sekä tutkijoiden haluttomuuteen luovuttaa keräämänsä, ja usein kovin henkilökohtaisina pitämänsä, tutkimusaineistot jatkokäyttöön. Kävikin varsin selväksi, että niin esimerkiksi Yhdysvaltojen, Euroopan kuin Afrikankin data-arkistoissa arkistotyöntekijät saavat vakuutella aineistoja kerääviä tutkijoita arkistoinnin hyödyistä ja hälventää aineistojen arkistointiin liittyviä epäluuloja.

Positiivisena muutoksena työpajan osallistujat kertoivat havainneensa sen, että kun aikaisemmin tutkijat tulivat ensimmäisen kerran kysymään arkistointiin liittyviä neuvoja vasta aineistot kerättyään, ottavat he nykyään arkistointimahdollisuuden huomioon yhä useammin jo aineistonhallintasuunnitelmaa laatiessaan. Tämä mahdollistaa sen, että tutkittavilta voidaan pyytää asianmukainen suostumus aineiston arkistointiin jo aineistoa kerättäessä.

IASSISTin varsinaiset luentosessiot oli jaettu teemansa perusteella kolmeen eri ryhmään. Tämä auttoi runsaudenpulasta kärsiviä konferenssiosallistujia valitsemaan monista päällekkäisistä sessioista itselle sopivimmat sen perusteella, kiinnostivatko häntä aineistonhallintaan liittyvät kysymykset, aineistopalvelujen ammatillinen kehittäminen vai datainfrastruktuuri ja -sovellukset. Itse osallistuin pääasiassa kahden ensimmäisen ryhmän luentosessioihin.

Luennot vahvistivat jo työpajassa tekemääni havaintoa siitä, että tutkimusaineistojen arkistointiin liittyvät kysymykset ovat pitkälti samanlaisia maasta ja arkistosta riippumatta. IASSIST tarjoaakin hienon tilaisuuden keskustella yhteisistä haasteista ja kehityssuunnista eri maista tulevien saman alan asiantuntijoiden kanssa. Samalla se tarjoaa vuosittain hyvän katsauksen siitä, mihin suuntaan eri maiden data-arkistot ovat kehittäneet toimintaansa ja palvelujansa edellisen vuoden aikana.

Ammatillisen verkostoitumismahdollisuuden lisäämiseksi IASSIST-konferenssiin kuuluu myös vapaamuotoisempaa ohjelmaa, kuten perinteinen ensimmäisen konferenssipäivän iltavastaanotto. Tällä kertaa vastaanotto järjestettiin Frank Gehryn suunnittelemassa upeassa Weisman Art Museumissa. Vastaanoton ohella perinteisesti yksi IASSISTin odotetuimpia tilaisuuksia varsinaisen konferenssiohjelman ulkopuolella on torstai-illan juhlaillallinen, jossa kansainvälisiä arkistokuulumisia voi vaihtaa hyvän ruoan ja juoman parissa.

IASSIST tarjosi siis jälleen kerran kattavan paketin tutkimusaineistojen arkistointiin ja jatkokäyttöön liittyviä näkökulmia. Seuraavan kerran IASSIST järjestetään Norjan Bergenissä touko-kesäkuun vaihteessa vuonna 2016. Osallistumista voin suositella kaikille tutkimusaineistojen arkistoinnin parissa työskenteleville, tieteenalaan katsomatta.

Lisätietoa:
» IASSIST
» IASSIST 2015 -konferenssi
» NVivo
» Qualitative Data Repository

Jarkko Päivärinta
tietopalveluasiantuntija
etunimi.sukunimi [at] uta.fi

Saitko viestin tietoarkiston aineistonhankkijoilta?

Saitko tietoarkistosta sähköpostia, jolla suostuttelemme sinua arkistoimaan aineistosi? Tietoarkistosta on lähtenyt tänä vuonna yli 250 samansisältöistä viestiä tutkijoille, joilla saattaa olla arkistoitavaa arvokasta tutkimusaineistoa. Mitään spämmiä viestit eivät ole, vaikka yhdenmukainen sisältö saattaa sen vaikutelman antaa – niille jotka ovat saaneet jo useamman hankintakirjeen. Käymme läpi kaikki tietokannassamme niin sanotulla hankintalistalla olevat aineistot muutaman kerran vuodessa ja lähetämme viestit massapostituksena arviomme mukaan hankittaviksi soveltuvista aineistoista.

Vastauksia saamme vaihtelevasti. Jotkut ottavat viestin vakavasti, toiset luultavasti deletoivat pyynnön asiaa paljon miettimättä. Hankinnan massaposteja on lähetetty tietoarkistosta noin viisi vuotta. Jotakin muutosta tuntuu reaktioissa tapahtuneen. Aiempaa useammin vastaus on myönteinen. Tutkija kysyy vain, miten edetään. Yhä useammin vastaus on jotakin seuraavanlaista: ”Teette hienoa työtä ja tutkimusaineistojen arkistointi on tärkeää, mutta valitettavasti en voi antaa aineistoani arkistoon, koska olen aiheen arkaluontoisuuden vuoksi luvannut tutkittavilleni, että aineistoa ei käytetä muuhun tarkoitukseen.” Jotkut pitävät arkistointia suorastaan arveluttavana.

Joskus jaksan ymmärtää, toisinaan ihmettelen. Pari kummallisinta arkaluonteista aineistoa, joita emme saaneet arkistoon ovat – aiheita hieman karkeistaen – erään lemmikkieläimen omistajien haastattelujen litteraatiot ja erään niin sanotun tosi-TV-sarjan osallistujien haastattelujen litteraatiot. Mitä tulenarkaa on eläimen omistamisessa? Mitä tosi-TV-sarjan osallistujat ovat jättäneet paljastamatta? Jännittävää! Jäänee ikuiseksi arvoitukseksi.

Onneksi nykyään saamme arkistoon sensitiivisiäkin tietoja sisältäviä aineistoja ja aineistoja, joita kerätessään tutkijat eivät ole tulleet ajatelleeksi, että joku muu voisi hyötyä aineistosta. Tutkijat luottavat siihen, että aineisto pysyy tallessa ja käyttökunnossa tietoarkistossa ja että tutkittavien tietoja käsitellään samojen tutkimuseettisten periaatteiden mukaisesti kuin alkuperäistutkimuksessakin.

Varovaisen positiivisen muutoksen taustalla lienee Suomen Akatemian ja muiden rahoittajien lisääntynyt kiinnostus rahoittamiensa hankkeiden aineistoja kohtaan. Rahoittajat ovat alkaneet vaatia aineistonhallintasuunnitelmia rahoituksen hakijoilta useissa muissakin maissa, ei pelkästään Suomessa. Samoin toimii myös Ruotsin Vetenskapsrådet.

Tietoarkistoissa muutokset ovat kasvattaneet tietopalvelun työmäärää – mikä on myönteistä. Mitä useammalle tutkijalle saamme kertoa, miten tutkimusdata tulee kerätä ja käsitellä ja miten tutkittaville pitää kertoa aineiston käyttötarkoituksesta, sitä useampi arvokas aineisto tulee (vähän) helpommin arkistoon, kun hanke päättyy. Mielellämme korostamme, että aineiston arkistoiminen on myös yksi tieteellinen meriitti muiden joukossa.

Uusimman Tietoarkisto-lehden teema on terveyden tutkimuksen aineistot. Lehdestä voit lukea muutamia esimerkkejä arkistoiduista aineistoista, jotka sisältävät sensitiivistä tietoa. Juuri siksi ne on kannattanut arkistoida.

Helena Laaksonen
informaatikko
etunimi.sukunimi@uta.fi