Tag Archives: arkistointi

Miksi terveys- ja lääketieteiden aineistot pitäisi arkistoida?

Arto Vuoren, THL, sanoin suomalaisilla hyvinvointi- ja terveysalan viranomaisilla ja tutkimuslaitoksilla on hallussaan kansainvälisesti verrattuna mittavat ja arvokkaat tietovarannot väestön palveluiden käytöstä ja terveydentilasta. Lainsäädäntö antaa mahdollisuuden käyttää tietoja tilastointiin, tutkimukseen ja biopankkitoimintaan.

Lakisääteisesti talletettujen tietojen lisäksi tutkijoilla ja tutkimusryhmillä on hallussaan kyselyin kerättyä tietoa muun muassa ihmisten elintavoista, työn asettamista haasteista, asenteista ja perhetilanteista.

Yhdistämällä olemassa olevia aineistoja eri lähteistä päästään tutkimaan sairauksien, työkyvyttömyyden ja hyvinvoinnin tausta- ja riskitekijöitä kokonaisvaltaisesti. Uusia hoitoja voidaan kehittää nopeammin ja poliittisen päätöksenteon pohjaksi saadaan tuotettua ajanmukaista tietoa. Terveydelle haitallisten altisteiden jäljille voidaan päästä nopeammin, ilman jopa vuosikymmeniä kestävää uutta tiedonkeruuta.

Aineisto on arvokas myös sellaisenaan. Jos aineistot olisivat saatavilla muuhunkin kuin alkuperäiseen tutkimukseen, toiset tutkijat voisivat tutkia ilmiötä eri näkökulmasta, jopa kokonaan toisen tieteenalan vinkkelistä.

Myös tutkittavien näkökulmalla on merkitystä. Tietokonepohjaisten kyselyjen, ja ylipäänsäkin kyselyjen, lisääntyessä perinteisesti hyvin tutkimukseen osallistuneiden suomalaisten halukkuus osallistua on laskussa. Tutkittavien taakan vähentämiseksi jokaista uutta kyselyä suunnitellessa olisi syytä miettiä hyvin tarkkaan, tarvitseeko uutta aineistoa kerätä, vai löytyisikö jo kerätyistä, arkistoiduista aineistoista tarvittava tieto.

Tämän vuoksi kaikki ihmisen terveyteen ja käyttäytymiseen liittyvät tutkimusaineistot, joilla arvellaan olevan alkuperäistä tutkimusta laajempaa hyötyä tutkimukselle, olisi arkistoitava.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan toinen osa. Ks. ensimmäinen osa.

Arkistoinnista poliittiseen päätöksentekoon

Tutkimusaineistojen arkistointi parantaa yhteiskunnasta kaikki taudit ja vaivat. Ei ole niin pientä tai isoa huolta, ettei siihen löytyisi helpotusta jo arkistoidusta aineistosta. Vai kuinka se nyt menikään? Ehkä on sittenkin syytä palata vähän taaksepäin ja aloittaa alusta.

Terveydenhuoltotutkimuksen päivillä Liina-Kaisa Tynkkynen Tampereen yliopistosta piti erinomaisen esitelmän aiheesta, miten saada tutkimustulokset nousemaan akateemisen kiinnostuksen tasolta poliittisen päätöksenteon pohjatiedoksi. Erityisesti nyt, kun yhteiskunnassa tehdään isoja muutoksia rakenteisiin, soisi päätösten pohjautuvan tutkittuun tietoon, ei pelkästään poliittisiin agendoihin.

Tärkein viesti Tynkkysen puheessa oli tutkimustiedon esiin tuomisen oikea ajankohta. Jokaisessa päätösprosessissa on olemassa tietty vaihe, mahdollisuuksien ikkuna, jonka aikana päättäjille tuotu tieto vaikuttaa.

Tärkeää on myös osata viestiä asiastansa oikein. Viestin sisältöä pohtiessa on syytä kiinnittää huomiota siihen, mikä viesti itse asiassa on. Keneen halutaan vaikuttaa: poliittisiin päättäjiin, yleiseen mielipiteeseen vai esimerkiksi terveydenhuollon tuottajiin? Entä mikä olisi hyvä viestintäkanava, ja kenen kannattaisi viedä viestiä päättäjille? Tutkija itse ei ole aina paras mahdollinen valinta. Olennaista on myös tehdä itsellensä selväksi, mitä haluaa saada aikaan: onko tarkoitus tarjota ratkaisuja tai antaa päätöksentekoprosessiin uutta tietoa vai tuoda päättäjille esiin ongelma?

Toki tutkijan vaikuttamisen tiellä on monia haasteita. Esimerkiksi poliittinen ilmapiiri ei ehkä juuri nyt ole kaikkein otollisin – Suomessa tuntuu olevan vallalla kulttuuri, jossa tehdään mieluummin kokeiluja kuin tutkimustietoon nojaavia päätöksiä. Realisti ymmärtää, että yksittäisellä tutkimuksella tuskin pystyy muuttamaan politiikan suuntaa. Toisaalta kannattaa muistaa, että mitä enemmän luotettavaa tutkimustietoa kertyy, sitä vahvempi paino sillä on.

Ja miten tämä kaikki taas liittyy tutkimusaineistojen arkistointiin? Tutkimuksen ei tarvitse jäädä yksittäiseksi tähdenlennoksi, jonka mahdollisuus päästä vaikuttamaan asioihin jää pieneksi, vaan tutkimusaineiston voi arkistoida ja saattaa muiden tutkijoiden käyttöön. Tällöin kenties toinen, samaa ilmiötä tutkiva henkilö, voi käyttää sitä oman aineistonsa lisänä tai löytää ilmiöön uuden tutkimusnäkökulman, ja viesti pääsee vahvistumaan. Myös jo unohtuneet tutkimustulokset voidaan ottaa vertailukohdaksi ja parhaimmillaan kahden aineiston avulla verrata tilannetta ennen ja jälkeen tapahtuneen muutoksen.

Tietoarkistokin muuten oli esillä Terveydenhuoltotutkimuksen päivillä. Ensimmäisen päivän rinnakkaissessiossa pääsin itse pitämään esitelmän terveystietoja sisältävien aineistojen arkistoinnista. Lisäksi tapahtumassa oli esillä Tietoarkiston palveluportaali Ailasta kertova rollup.

Lisätietoa:
» Terveydenhuoltotutkimuksen päivät 2015
» Tietoarkiston palveluportaali Aila

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Arkistoinnista poliittiseen päätöksentekoon

Tutkimusaineistojen arkistointi parantaa yhteiskunnasta kaikki taudit ja vaivat. Ei ole niin pientä tai isoa huolta, ettei siihen löytyisi helpotusta jo arkistoidusta aineistosta. Vai kuinka se nyt menikään? Ehkä on sittenkin syytä palata vähän taaksepäin ja aloittaa alusta.

Terveydenhuoltotutkimuksen päivillä Liina-Kaisa Tynkkynen Tampereen yliopistosta piti erinomaisen esitelmän aiheesta, miten saada tutkimustulokset nousemaan akateemisen kiinnostuksen tasolta poliittisen päätöksenteon pohjatiedoksi. Erityisesti nyt, kun yhteiskunnassa tehdään isoja muutoksia rakenteisiin, soisi päätösten pohjautuvan tutkittuun tietoon, ei pelkästään poliittisiin agendoihin.

Tärkein viesti Tynkkysen puheessa oli tutkimustiedon esiin tuomisen oikea ajankohta. Jokaisessa päätösprosessissa on olemassa tietty vaihe, mahdollisuuksien ikkuna, jonka aikana päättäjille tuotu tieto vaikuttaa.

Tärkeää on myös osata viestiä asiastansa oikein. Viestin sisältöä pohtiessa on syytä kiinnittää huomiota siihen, mikä viesti itse asiassa on. Keneen halutaan vaikuttaa: poliittisiin päättäjiin, yleiseen mielipiteeseen vai esimerkiksi terveydenhuollon tuottajiin? Entä mikä olisi hyvä viestintäkanava, ja kenen kannattaisi viedä viestiä päättäjille? Tutkija itse ei ole aina paras mahdollinen valinta. Olennaista on myös tehdä itsellensä selväksi, mitä haluaa saada aikaan: onko tarkoitus tarjota ratkaisuja tai antaa päätöksentekoprosessiin uutta tietoa vai tuoda päättäjille esiin ongelma?

Toki tutkijan vaikuttamisen tiellä on monia haasteita. Esimerkiksi poliittinen ilmapiiri ei ehkä juuri nyt ole kaikkein otollisin – Suomessa tuntuu olevan vallalla kulttuuri, jossa tehdään mieluummin kokeiluja kuin tutkimustietoon nojaavia päätöksiä. Realisti ymmärtää, että yksittäisellä tutkimuksella tuskin pystyy muuttamaan politiikan suuntaa. Toisaalta kannattaa muistaa, että mitä enemmän luotettavaa tutkimustietoa kertyy, sitä vahvempi paino sillä on.

Ja miten tämä kaikki taas liittyy tutkimusaineistojen arkistointiin? Tutkimuksen ei tarvitse jäädä yksittäiseksi tähdenlennoksi, jonka mahdollisuus päästä vaikuttamaan asioihin jää pieneksi, vaan tutkimusaineiston voi arkistoida ja saattaa muiden tutkijoiden käyttöön. Tällöin kenties toinen, samaa ilmiötä tutkiva henkilö, voi käyttää sitä oman aineistonsa lisänä tai löytää ilmiöön uuden tutkimusnäkökulman, ja viesti pääsee vahvistumaan. Myös jo unohtuneet tutkimustulokset voidaan ottaa vertailukohdaksi ja parhaimmillaan kahden aineiston avulla verrata tilannetta ennen ja jälkeen tapahtuneen muutoksen.

Tietoarkistokin muuten oli esillä Terveydenhuoltotutkimuksen päivillä. Ensimmäisen päivän rinnakkaissessiossa pääsin itse pitämään esitelmän terveystietoja sisältävien aineistojen arkistoinnista. Lisäksi tapahtumassa oli esillä Tietoarkiston palveluportaali Ailasta kertova rollup.

Lisätietoa:
» Terveydenhuoltotutkimuksen päivät 2015
» Tietoarkiston palveluportaali Aila

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Mitä tutkijat ajattelevat terveys- ja lääketieteen aineistojen arkistoinnista?

Tutkimusaineistojen avoimuus on jo tavallista biotieteissä ja monilla luonnontieteiden aloilla, mutta useilla muilla aloilla avoimuus on harvinaista ja lääketieteessä sitä on hädin tuskin edes harkittu. Tutkimusaineistojen avoimuusvaatimus koskee kuitenkin myös terveys- ja lääketieteitä. Tietoarkisto onkin laajentamassa palveluitaan, jotta myös näiden alojen aineistoille saadaan asianmukaiset käytännöt arkistointiin ja aineistojen jatkokäyttöön.

Kartoittaaksemme tutkijoiden tarpeita, toteutimme toukokuussa 2015 tutkijakyselyn, jossa selvitimme tutkijoiden ajatuksia ja käytäntöjä tutkimusaineistojen jatkohyödyntämisestä. Kysely suunnattiin Tietoarkiston uusille tieteenaloille, humanististen ja lääke- ja terveystieteiden tutkijoille, pois lukien biotieteiden ala. Tässä kirjoituksessani käsittelen terveystieteiden tutkijoiden vastauksia.

Puolet vastaajista oli tietoisia rahoittajien (esim. Suomen Akatemia ja TEKES) ja julkaisijoiden suosituksista ja edellytyksistä avata tutkimusaineistot tiedeyhteisön käyttöön. Tästä huolimatta vain neljäsosa arkistoi aineistonsa omaan yliopistoonsa tai tutkimuslaitokseensa, ja vain neljä prosenttia arkistoi aineistoja erilliseen arkistoimisyksikköön.

Miksi näin harva? Aineistojen jakaminen tutkimusryhmien kesken kun on kuitenkin yleinen käytäntö terveys- ja lääketieteissä.

Osaltaan syynä on väärinymmärrys. Monen tutkijan käsityksen mukaan arkaluonteisia tietoja sisältävää aineistoa ei saa arkistoida muuta tutkimuskäyttöä varten.

Aineiston voi kuitenkin arkistoida, kun siitä ensin poistetaan tunnistetiedot, eli aineisto anonymisoidaan. Mahdollista on myös poistaa aineistosta kaikkein arkaluonteisin osa ja arkistoida vähemmän arkaluonteiset tiedot. Tietoarkistossa anonymisointi ja tutkittavien tietosuojan varmistaminen onkin keskeinen osa arkistointiprosessia.

Tutkijoita huolestuttaa myös se, että ulkopuolinen ei pysty käyttämään aineistoa oikein. Arkistoitava aineisto kuitenkin kuvaillaan Tietoarkistossa niin perin pohjin, että uusi käyttäjä saa tietoonsa miten tiedot on kerätty ja mitä rajoituksia eri muuttujiin liittyy. Tutkija voi myös halutessaan rajata aineiston jatkokäyttöä päättämällä hakemuskohtaisesti, kenelle jatkokäyttölupa myönnetään. Kyselyssä tutkijat toivoivat myös, että heillä olisi oikeus rajata, millainen osa aineistosta hakijalle kulloinkin annetaan.

Tutkittavien informoinnissa ja suostumusten keräämisessä käytetään usein suostumusmallia, jossa tutkittaville kerrotaan aineistoa käytettävän vain yhteen tutkimukseen, ja että tutkimuksen päätyttyä aineisto hävitetään. On myös tavallista kirjoittaa eettisen luvan hakemukseen sen kummemmin asiaa harkitsematta, että aineistoa käytetään vain tähän tutkimukseen ja tutkimuksen loputtua aineisto hävitetään.

Eettiset toimikunnatkin voivat tulkita lakia jyrkemmin kuin lain kirjain vaatii. Eettisen lausunnon saamiseen voi liittyä vaatimuksia aineiston hävittämisestä tai muista rajoituksista. Myös tutkijat itse voivat pitää arkaluonteisen aineiston arkistointia eettisesti arveluttavana, vaikka anonyymin aineiston arkistoinnin sallisi sekä lainsäädäntö että eettinen toimikunta.

Yksi selitys sille, että aineistoja ei juuri arkistoida, on myös se, että tutkijat eivät ole tietoisia arkistointiin ja aineistojen jatkokäyttöön tähtäävästä tutkimuspolitiikasta, eikä muun muassa Tietoarkistoa tai sen palveluita vielä tunneta. Julkaisujen vaatimukset artikkeliin liittyvän tutkimusaineiston avaamisesta ovat jo tutumpia.

Tieto arkistoimisen hyödyistä kuitenkin leviää. Tietoarkistojen ja tutkijoiden välisen yhteistyön lisääntyessä edetään kohti tilannetta, jossa aineistot käytetään hyödyksi tehokkaasti. Tämä säästää tutkimuksessa arvokasta aikaa ja rahaa sekä altistaa tutkittavia vähemmille tutkimuksille.

Lopuksi yhden vastaajan kirjoitus aineistojen jakamisesta: ”Tutkimusryhmämme on jo avannut aineistoja laajasti suomalaisille ja kansainvälisille tutkimusryhmille. Olemme tietojeni mukaan saaneet tiedostojen jakamisesta pelkästään hyötyä ja positiivista palautetta sekä kymmeniä hyviä yhteisjulkaisuja. Tämän lisäksi tutkimus kuuluu kymmeniin kansainvälisiin genetiikan alan konsortiotutkimuksiin, mistä on saatu hyötynä kymmeniä huippujulkaisuja. Aineistojen jakamisesta on hyötyä myös siksi, että vastavuoroisesti meille on auennut mahdollisuus käyttää kansanvälisiä aineistoja, mikä on parantanut mahdollisuuksia julkaisujen hyväksymisestä alan huippulehtiin.

Lisätietoa:
Tutkimusaineistojen avoimen saatavuuden määrittelystä ja asiaan liittyvistä taustatekijöistä voi lukea tarkemmin Tietoarkistolehdessä 2/2014.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan ensimmäinen osa. Ks. toinen osa.

Mitä tutkijat ajattelevat terveys- ja lääketieteen aineistojen arkistoinnista?

Tutkimusaineistojen avoimuus on jo tavallista biotieteissä ja monilla luonnontieteiden aloilla, mutta useilla muilla aloilla avoimuus on harvinaista ja lääketieteessä sitä on hädin tuskin edes harkittu. Tutkimusaineistojen avoimuusvaatimus koskee kuitenkin myös terveys- ja lääketieteitä. Tietoarkisto onkin laajentamassa palveluitaan, jotta myös näiden alojen aineistoille saadaan asianmukaiset käytännöt arkistointiin ja aineistojen jatkokäyttöön.

Kartoittaaksemme tutkijoiden tarpeita, toteutimme toukokuussa 2015 tutkijakyselyn, jossa selvitimme tutkijoiden ajatuksia ja käytäntöjä tutkimusaineistojen jatkohyödyntämisestä. Kysely suunnattiin Tietoarkiston uusille tieteenaloille, humanististen ja lääke- ja terveystieteiden tutkijoille, pois lukien biotieteiden ala. Tässä kirjoituksessani käsittelen terveystieteiden tutkijoiden vastauksia.

Puolet vastaajista oli tietoisia rahoittajien (esim. Suomen Akatemia ja TEKES) ja julkaisijoiden suosituksista ja edellytyksistä avata tutkimusaineistot tiedeyhteisön käyttöön. Tästä huolimatta vain neljäsosa arkistoi aineistonsa omaan yliopistoonsa tai tutkimuslaitokseensa, ja vain neljä prosenttia arkistoi aineistoja erilliseen arkistoimisyksikköön.

Miksi näin harva? Aineistojen jakaminen tutkimusryhmien kesken kun on kuitenkin yleinen käytäntö terveys- ja lääketieteissä.

Osaltaan syynä on väärinymmärrys. Monen tutkijan käsityksen mukaan arkaluonteisia tietoja sisältävää aineistoa ei saa arkistoida muuta tutkimuskäyttöä varten.

Aineiston voi kuitenkin arkistoida, kun siitä ensin poistetaan tunnistetiedot, eli aineisto anonymisoidaan. Mahdollista on myös poistaa aineistosta kaikkein arkaluonteisin osa ja arkistoida vähemmän arkaluonteiset tiedot. Tietoarkistossa anonymisointi ja tutkittavien tietosuojan varmistaminen onkin keskeinen osa arkistointiprosessia.

Tutkijoita huolestuttaa myös se, että ulkopuolinen ei pysty käyttämään aineistoa oikein. Arkistoitava aineisto kuitenkin kuvaillaan Tietoarkistossa niin perin pohjin, että uusi käyttäjä saa tietoonsa miten tiedot on kerätty ja mitä rajoituksia eri muuttujiin liittyy. Tutkija voi myös halutessaan rajata aineiston jatkokäyttöä päättämällä hakemuskohtaisesti, kenelle jatkokäyttölupa myönnetään. Kyselyssä tutkijat toivoivat myös, että heillä olisi oikeus rajata, millainen osa aineistosta hakijalle kulloinkin annetaan.

Tutkittavien informoinnissa ja suostumusten keräämisessä käytetään usein suostumusmallia, jossa tutkittaville kerrotaan aineistoa käytettävän vain yhteen tutkimukseen, ja että tutkimuksen päätyttyä aineisto hävitetään. On myös tavallista kirjoittaa eettisen luvan hakemukseen sen kummemmin asiaa harkitsematta, että aineistoa käytetään vain tähän tutkimukseen ja tutkimuksen loputtua aineisto hävitetään.

Eettiset toimikunnatkin voivat tulkita lakia jyrkemmin kuin lain kirjain vaatii. Eettisen lausunnon saamiseen voi liittyä vaatimuksia aineiston hävittämisestä tai muista rajoituksista. Myös tutkijat itse voivat pitää arkaluonteisen aineiston arkistointia eettisesti arveluttavana, vaikka anonyymin aineiston arkistoinnin sallisi sekä lainsäädäntö että eettinen toimikunta.

Yksi selitys sille, että aineistoja ei juuri arkistoida, on myös se, että tutkijat eivät ole tietoisia arkistointiin ja aineistojen jatkokäyttöön tähtäävästä tutkimuspolitiikasta, eikä muun muassa Tietoarkistoa tai sen palveluita vielä tunneta. Julkaisujen vaatimukset artikkeliin liittyvän tutkimusaineiston avaamisesta ovat jo tutumpia.

Tieto arkistoimisen hyödyistä kuitenkin leviää. Tietoarkistojen ja tutkijoiden välisen yhteistyön lisääntyessä edetään kohti tilannetta, jossa aineistot käytetään hyödyksi tehokkaasti. Tämä säästää tutkimuksessa arvokasta aikaa ja rahaa sekä altistaa tutkittavia vähemmille tutkimuksille.

Lopuksi yhden vastaajan kirjoitus aineistojen jakamisesta: ”Tutkimusryhmämme on jo avannut aineistoja laajasti suomalaisille ja kansainvälisille tutkimusryhmille. Olemme tietojeni mukaan saaneet tiedostojen jakamisesta pelkästään hyötyä ja positiivista palautetta sekä kymmeniä hyviä yhteisjulkaisuja. Tämän lisäksi tutkimus kuuluu kymmeniin kansainvälisiin genetiikan alan konsortiotutkimuksiin, mistä on saatu hyötynä kymmeniä huippujulkaisuja. Aineistojen jakamisesta on hyötyä myös siksi, että vastavuoroisesti meille on auennut mahdollisuus käyttää kansanvälisiä aineistoja, mikä on parantanut mahdollisuuksia julkaisujen hyväksymisestä alan huippulehtiin.

Lisätietoa:
Tutkimusaineistojen avoimen saatavuuden määrittelystä ja asiaan liittyvistä taustatekijöistä voi lukea tarkemmin Tietoarkistolehdessä 2/2014.

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kirjoitus on kolmiosaisen terveys- ja lääketieteitä käsittelevän postaussarjan ensimmäinen osa. Ks. toinen osa.

Sähköistä säilyttämistä ja sporttista tunnelmaa Dublinissa

Gaelilaisten urheilulajien suorituspaikka, Dublinin Croke Park –stadion saattaa aluksi tuntua melko erikoiselta paikalta järjestää digitaaliseen säilyttämiseen keskittyvä konferenssi. Onko tauoilla kenties tarkoitus pelata hurlingia tai gaelilaista käsipalloa? Pitääkö varoa, ettei joudu lounasjonossa taklatuksi? Nämä huolet osoittautuivat turhiksi, sillä sporttisesta ympäristöstään huolimatta kesäkuun lopulla stadionilla järjestetyssä The 1st Annual Conference on Digital Preservation for the Arts, Social Sciences and Humanities –konferenssissa (DPASSH) ei tarvinnut pelätä, että hiki nousisi pintaan ainakaan liikkumisesta. Ainoat lihaksetkin, jotka rasittuivat, olivat lähinnä istumalihaksia, sillä kaksipäiväisen konferenssin ohjelma oli tiivis.

Konferenssin tarkoituksena oli keskittyä erityisesti sellaisiin digitaalisen säilyttämisen haasteisiin, jotka ovat tyypillisiä humanistisille ja yhteiskuntatieteellisille aloille sekä taiteen tutkimukselle. Sen sponsorina toimi The Digital Repository of Ireland (DRI), joka oli näkyvässä roolissa koko konferenssin ajan. DRI on kansallinen infrastruktuuri, joka pyrkii säilyttämään, hoitamaan ja välittämään Irlannin kulttuuriperintöaineistoja sekä humanistista ja yhteiskuntatieteellistä dataa. Säilyttämisperiaate nousee aivan uuteen valoon, kun otetaan huomioon, että vuonna 1922 sisällissodan melskeissä tapahtunut asiakirja-arkiston (The Public Record Office of Ireland) tulipalo tuhosi suurimman osan Irlannin historiallisesta asiakirja-aineistosta 1200-luvun taitteesta vuoteen 1922. DRI:n tarkoituksena onkin kootusti kerätä yhteen olemassa olevat historian ja nykypäivän tietoaineistot tutkimuksen, opiskelun ja suuren yleisön saataville. DRI:lle on lisäksi heinäkuun alussa myönnetty arvostettu Data Seal of Approval –sertifikaatti, joka myönnetään organisaatioille, jotka säilyttävät sähköisiä aineistoja luotettavasti sekä mahdollistavat niiden jatkokäytön.

Konferenssin osallistujalista oli melko irlantilaisvoittoinen, mutta ilokseni mukaan oli eksynyt myös pohjoismainen kollega, Ruotsin tietoarkiston eli SND:n kieliaineistoista vastaava Caspar Jordan. Myös CSC oli lähettänyt paikalle KDK-PAS-hankkeen (Kansallinen Digitaalinen Kirjasto – Pitkäaikaissäilytys) kehitystyössä mukana olleen it-puolen edustajan. KDK:n perusideahan on hyvin samankaltainen kuin DRI:n, toisin sanoen digitaalisten kulttuuriperintöaineistojen keskitetyn pitkäaikaissäilytyspalvelun suunnittelu ja toteuttaminen.

Konferenssin punaisena lankana toimikin huoli ja vastuu valtavien aineistomassojen säilymisestä ja säilyttämisestä. Kun jo puhtaasti analogista historiallista, taiteellista, yhteiskuntatieteellistä ja kulttuuriperintöön liittyvää aineistoa on valmiina kilometrikaupalla, tuo omat haasteensa nykyinen digitaalinen aika, joka tuottaa jatkuvalla syötöllä valtavia, yli ymmärryksen käyviä aineistomassoja. Osa esityksistä pohdiskelikin erityisesti sitä, miten sovittaa analogiset aineistot digitaalisiin työnkulkuihin. Toisaalta taas osa esityksistä keskittyi nimenomaisesti jatkuvasti tuotettuun digitaaliseen materiaaliin ja sen mielekkääseen säilyttämiseen. Kuinka alati karttuvaa aineistoa (esimerkiksi Facebookissa, Twitterissä, e-lehdissä, jne.) saa talteen sitä vauhtia kuin sitä tuotetaan ja onko kaiken säilyttäminen ylipäätään mielekästä? Nykyisen digitalisoitumisen myötä erilaiset aineistot ovat lisäksi varsin hyvin saatavilla, mutta haasteita luo niiden pitkäaikaissäilytyksen turvaaminen, omistajuuteen niveltyvät kysymykset tai teknisiin ratkaisuihin liittyvät seikat.

Pääosassa olivat aineistot ja sisällöt, paikoin myös teoreettiset lähestymistavat tai aineiston hallinnan kysymykset. Melko monen esityksenpitäjän taustaorganisaatio tai projekti oli sellainen, jossa arkistoinnin lisäksi myös aktiivisesti digitoidaan aineistoja. Erilaisten esimerkkitapausten avulla avattiin sisällöllisiä ja käytännöllisiä ratkaisuja säilyttämiskysymyksiin. Muuan esitys viihdytti yleisöä esittelemällä varhaisen, 1990-lopun online-taideprojektin, The Bono Probability Positioning Systemin, joka toimi eräällä tapaa Google Street View -sovelluksen edeltäjänä. Sen ideana oli liittää erinäisiin Dublinin karttakohteisiin todennäköisyyslaskelma siitä, miten suurella todennäköisyydellä paikassa saattoi törmätä U2-yhtyeen nokkamieheen Bonoon. Projekti oli kieli poskessa luotu ja todennäköisyyslaskelmat täysin hatusta temmattuja. Projekti toimi kuitenkin hyvänä esimerkkinä siitä, millaisia haasteita on pyrkimyksessä säilyttää vanhempaa nettiin luotua digitaalista sisältöä, jota ei alun perin ole ajateltu säilytettäväksi. Perinteisempää ja arkistoalalle tyypillisempiä ongelmia pohdittiin muun muassa esityksissä, jossa esiteltiin arkaluontoiseen aineistoon liittyviä eettisiä ongelmia tai metadatan käsittelyä.

Kodikasta humanistihenkeä ja yhdessä tekemisen ilosanomaa huokunut konferenssi oli leppoisa kokemus, joka kuitenkin tarjosi melko monipuolisen kattauksen digitaalisten aineistojen kirjavaan maailmaan. Konferenssin irlantilaiset järjestäjät toivoivatkin, että DPASSH muodostuisi jokavuotiseksi. Tämän toiveen allekirjoitan mielihyvin.

Lisätietoa:
» DPASSH 2015
» The Digital Repository of Ireland
» The Bono Probability Positioning System

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Sähköistä säilyttämistä ja sporttista tunnelmaa Dublinissa

Gaelilaisten urheilulajien suorituspaikka, Dublinin Croke Park –stadion saattaa aluksi tuntua melko erikoiselta paikalta järjestää digitaaliseen säilyttämiseen keskittyvä konferenssi. Onko tauoilla kenties tarkoitus pelata hurlingia tai gaelilaista käsipalloa? Pitääkö varoa, ettei joudu lounasjonossa taklatuksi? Nämä huolet osoittautuivat turhiksi, sillä sporttisesta ympäristöstään huolimatta kesäkuun lopulla stadionilla järjestetyssä The 1st Annual Conference on Digital Preservation for the Arts, Social Sciences and Humanities –konferenssissa (DPASSH) ei tarvinnut pelätä, että hiki nousisi pintaan ainakaan liikkumisesta. Ainoat lihaksetkin, jotka rasittuivat, olivat lähinnä istumalihaksia, sillä kaksipäiväisen konferenssin ohjelma oli tiivis.

Konferenssin tarkoituksena oli keskittyä erityisesti sellaisiin digitaalisen säilyttämisen haasteisiin, jotka ovat tyypillisiä humanistisille ja yhteiskuntatieteellisille aloille sekä taiteen tutkimukselle. Sen sponsorina toimi The Digital Repository of Ireland (DRI), joka oli näkyvässä roolissa koko konferenssin ajan. DRI on kansallinen infrastruktuuri, joka pyrkii säilyttämään, hoitamaan ja välittämään Irlannin kulttuuriperintöaineistoja sekä humanistista ja yhteiskuntatieteellistä dataa. Säilyttämisperiaate nousee aivan uuteen valoon, kun otetaan huomioon, että vuonna 1922 sisällissodan melskeissä tapahtunut asiakirja-arkiston (The Public Record Office of Ireland) tulipalo tuhosi suurimman osan Irlannin historiallisesta asiakirja-aineistosta 1200-luvun taitteesta vuoteen 1922. DRI:n tarkoituksena onkin kootusti kerätä yhteen olemassa olevat historian ja nykypäivän tietoaineistot tutkimuksen, opiskelun ja suuren yleisön saataville. DRI:lle on lisäksi heinäkuun alussa myönnetty arvostettu Data Seal of Approval –sertifikaatti, joka myönnetään organisaatioille, jotka säilyttävät sähköisiä aineistoja luotettavasti sekä mahdollistavat niiden jatkokäytön.

Konferenssin osallistujalista oli melko irlantilaisvoittoinen, mutta ilokseni mukaan oli eksynyt myös pohjoismainen kollega, Ruotsin tietoarkiston eli SND:n kieliaineistoista vastaava Caspar Jordan. Myös CSC oli lähettänyt paikalle KDK-PAS-hankkeen (Kansallinen Digitaalinen Kirjasto – Pitkäaikaissäilytys) kehitystyössä mukana olleen it-puolen edustajan. KDK:n perusideahan on hyvin samankaltainen kuin DRI:n, toisin sanoen digitaalisten kulttuuriperintöaineistojen keskitetyn pitkäaikaissäilytyspalvelun suunnittelu ja toteuttaminen.

Konferenssin punaisena lankana toimikin huoli ja vastuu valtavien aineistomassojen säilymisestä ja säilyttämisestä. Kun jo puhtaasti analogista historiallista, taiteellista, yhteiskuntatieteellistä ja kulttuuriperintöön liittyvää aineistoa on valmiina kilometrikaupalla, tuo omat haasteensa nykyinen digitaalinen aika, joka tuottaa jatkuvalla syötöllä valtavia, yli ymmärryksen käyviä aineistomassoja. Osa esityksistä pohdiskelikin erityisesti sitä, miten sovittaa analogiset aineistot digitaalisiin työnkulkuihin. Toisaalta taas osa esityksistä keskittyi nimenomaisesti jatkuvasti tuotettuun digitaaliseen materiaaliin ja sen mielekkääseen säilyttämiseen. Kuinka alati karttuvaa aineistoa (esimerkiksi Facebookissa, Twitterissä, e-lehdissä, jne.) saa talteen sitä vauhtia kuin sitä tuotetaan ja onko kaiken säilyttäminen ylipäätään mielekästä? Nykyisen digitalisoitumisen myötä erilaiset aineistot ovat lisäksi varsin hyvin saatavilla, mutta haasteita luo niiden pitkäaikaissäilytyksen turvaaminen, omistajuuteen niveltyvät kysymykset tai teknisiin ratkaisuihin liittyvät seikat.

Pääosassa olivat aineistot ja sisällöt, paikoin myös teoreettiset lähestymistavat tai aineiston hallinnan kysymykset. Melko monen esityksenpitäjän taustaorganisaatio tai projekti oli sellainen, jossa arkistoinnin lisäksi myös aktiivisesti digitoidaan aineistoja. Erilaisten esimerkkitapausten avulla avattiin sisällöllisiä ja käytännöllisiä ratkaisuja säilyttämiskysymyksiin. Muuan esitys viihdytti yleisöä esittelemällä varhaisen, 1990-lopun online-taideprojektin, The Bono Probability Positioning Systemin, joka toimi eräällä tapaa Google Street View -sovelluksen edeltäjänä. Sen ideana oli liittää erinäisiin Dublinin karttakohteisiin todennäköisyyslaskelma siitä, miten suurella todennäköisyydellä paikassa saattoi törmätä U2-yhtyeen nokkamieheen Bonoon. Projekti oli kieli poskessa luotu ja todennäköisyyslaskelmat täysin hatusta temmattuja. Projekti toimi kuitenkin hyvänä esimerkkinä siitä, millaisia haasteita on pyrkimyksessä säilyttää vanhempaa nettiin luotua digitaalista sisältöä, jota ei alun perin ole ajateltu säilytettäväksi. Perinteisempää ja arkistoalalle tyypillisempiä ongelmia pohdittiin muun muassa esityksissä, jossa esiteltiin arkaluontoiseen aineistoon liittyviä eettisiä ongelmia tai metadatan käsittelyä.

Kodikasta humanistihenkeä ja yhdessä tekemisen ilosanomaa huokunut konferenssi oli leppoisa kokemus, joka kuitenkin tarjosi melko monipuolisen kattauksen digitaalisten aineistojen kirjavaan maailmaan. Konferenssin irlantilaiset järjestäjät toivoivatkin, että DPASSH muodostuisi jokavuotiseksi. Tämän toiveen allekirjoitan mielihyvin.

Lisätietoa:
» DPASSH 2015
» The Digital Repository of Ireland
» The Bono Probability Positioning System

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Juhlatunnelmia

Keskiviikko syyskuun 24. päivä oli tietoarkistossa ikimuistoinen: meille oli myönnetty Data Seal of Approval -sertifikaatti, tuttavallisemmin DSA. Se voidaan myöntää organisaatiolle, joka säilyttää sähköisiä aineistoja luotettavasti ja joka mahdollistaa aineistojen jatkokäytön. Tietoarkisto sai DSA:n ensimmäisenä suomalaisena organisaationa. Tällaista ei tapahdu ihan joka päivä eikä edes joka vuosi – oli siis kakkukahvien paikka!

Sertifikaatin saadaksemme meidän oli osoitettava, että toimimme mahdollisimman läpinäkyvästi, että noudatamme soveltuvia standardeja ja parhaita käytäntöjä ja että ymmärrämme ja hallitsemme toimintaamme liittyvät uhat ja riskit. Arviointikohtia oli yhteensä kuusitoista, ja kaikkien niiden osalta oli selitettävä toimintaperiaatteemme ja -käytäntömme. Pelkästään selittämällä DSA:ta ei kuitenkaan saa: väitteiden tueksi on esitettävä riittävä dokumentaatio. Menestyksekkään DSA-hakemuksemme kulmakivi oli arkistonmuodostussuunnitelmamme eli AMS. Sitä täydensi sisäinen käsikirjamme. Molemmat ovat tietoarkiston asiantuntijoiden pitkäjänteisen, jatkuvan, huolellisen ja innovatiivisen työn tuloksia.

DSA-sertifiointi oli samalla sekä omien toimintojemme kehittämistä ja vahvistamista että osa eurooppalaisen CESSDA ERIC -tutkimusinfrastruktuurin rakentamisprosessia. CESSDA-ERIC voi toimia tehokkaasti ja tarkoituksenmukaisesti vain, jos kaikki osapuolet toimivat yhteisten sääntöjen mukaan ja jos kaikki voivat luottaa toisiinsa.

Luottamusta rakentaakseen CESSDA käynnisti vuonna 2013 hankkeen, jossa jokainen palveluntuottaja teki itsearvioinnin DSA:ta käyttäen. Olin mukana hankkeen asiantuntijaryhmässä, joka kävi läpi kaikki itsearvioinnit ja valmisteli kehittämisraportin. Sen lisäksi, että työ oli äärimmäisen mielenkiintoista, se antoi vahvan luottamuksen siihen, että tietoarkiston käytännöt ja dokumentaatio ovat DSA-kunnossa.

Innostuneen juhlakahvittelun lomassa keskustelumme kääntyi tulevaisuuteen. DSA on vasta ensimmäinen taso kolmiportaisessa eurooppalaisessa sähköisen säilyttämisen arvioinnin viitekehyksessä. Toinen taso on ISO 16363 -standardiin perustuva itsearviointi ja kolmas taso ISO-standardin mukainen ulkoinen auditointi. Kakkunälkämme on jo kasvanut.

Lisätietoja:
» Tietoarkiston DSA-arviointi
» Työtä on tehty Suomen Akatemian rahoittamissa hankkeissa: VERIC ja TA15
» Tietoarkiston DSA-tiedote
» Tietoarkiston arkistonmuodostussuunnitelma

Mari Kleemola
tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

Juhlatunnelmia

Keskiviikko syyskuun 24. päivä oli tietoarkistossa ikimuistoinen: meille oli myönnetty Data Seal of Approval -sertifikaatti, tuttavallisemmin DSA. Se voidaan myöntää organisaatiolle, joka säilyttää sähköisiä aineistoja luotettavasti ja joka mahdollistaa aineistojen jatkokäytön. Tietoarkisto sai DSA:n ensimmäisenä suomalaisena organisaationa. Tällaista ei tapahdu ihan joka päivä eikä edes joka vuosi – oli siis kakkukahvien paikka!

Sertifikaatin saadaksemme meidän oli osoitettava, että toimimme mahdollisimman läpinäkyvästi, että noudatamme soveltuvia standardeja ja parhaita käytäntöjä ja että ymmärrämme ja hallitsemme toimintaamme liittyvät uhat ja riskit. Arviointikohtia oli yhteensä kuusitoista, ja kaikkien niiden osalta oli selitettävä toimintaperiaatteemme ja -käytäntömme. Pelkästään selittämällä DSA:ta ei kuitenkaan saa: väitteiden tueksi on esitettävä riittävä dokumentaatio. Menestyksekkään DSA-hakemuksemme kulmakivi oli arkistonmuodostussuunnitelmamme eli AMS. Sitä täydensi sisäinen käsikirjamme. Molemmat ovat tietoarkiston asiantuntijoiden pitkäjänteisen, jatkuvan, huolellisen ja innovatiivisen työn tuloksia.

DSA-sertifiointi oli samalla sekä omien toimintojemme kehittämistä ja vahvistamista että osa eurooppalaisen CESSDA ERIC -tutkimusinfrastruktuurin rakentamisprosessia. CESSDA-ERIC voi toimia tehokkaasti ja tarkoituksenmukaisesti vain, jos kaikki osapuolet toimivat yhteisten sääntöjen mukaan ja jos kaikki voivat luottaa toisiinsa.

Luottamusta rakentaakseen CESSDA käynnisti vuonna 2013 hankkeen, jossa jokainen palveluntuottaja teki itsearvioinnin DSA:ta käyttäen. Olin mukana hankkeen asiantuntijaryhmässä, joka kävi läpi kaikki itsearvioinnit ja valmisteli kehittämisraportin. Sen lisäksi, että työ oli äärimmäisen mielenkiintoista, se antoi vahvan luottamuksen siihen, että tietoarkiston käytännöt ja dokumentaatio ovat DSA-kunnossa.

Innostuneen juhlakahvittelun lomassa keskustelumme kääntyi tulevaisuuteen. DSA on vasta ensimmäinen taso kolmiportaisessa eurooppalaisessa sähköisen säilyttämisen arvioinnin viitekehyksessä. Toinen taso on ISO 16363 -standardiin perustuva itsearviointi ja kolmas taso ISO-standardin mukainen ulkoinen auditointi. Kakkunälkämme on jo kasvanut.

Lisätietoja:
» Tietoarkiston DSA-arviointi
» Työtä on tehty Suomen Akatemian rahoittamissa hankkeissa: VERIC ja TA15
» Tietoarkiston DSA-tiedote
» Tietoarkiston arkistonmuodostussuunnitelma

Mari Kleemola
tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

ICPSR:n kesäkurssit arkistoijan opinahjona

Michiganin yliopiston yhteydessä Ann Arborissa toimiva data-arkisto ICPSR (Inter-university Consortium for Political and Social Research) järjestää vuosittain lukuisia erilaisia kesäkursseja, joiden kohderyhmänä ovat tutkijat ja arkistoalan työntekijät ympäri maailmaa. Silloin tällöin myös Yhteiskuntatieteellinen tietoarkisto lähettää työntekijöitänsä Ann Arboriin hankkimaan koulutusta ja uusia ideoita tutkimusaineistojen arkistointiin. Samalla tarjoutuu hyvä mahdollisuus vaihtaa kokemuksia muualta maailmasta tulleiden arkistoalan työntekijöiden kanssa. Tänä vuonna matka-arpa osui omalle kohdalleni.

ICPSR:n kesäkurssien pääpaino on ollut perinteisesti vahvasti kvantitatiivisten tutkimusaineistojen puolella, mutta heinä-elokuun vaihteessa järjestetty viisipäiväinen Curating and Managing Research Data for Re-Use tarjosi kiinnostavia näkökulmia myös kvalitatiivisten aineistojen käsittelyyn ja arkistointiin.

Kurssille osallistui 26 eri tavoin tutkimusaineistojen arkistoinnin parissa työskentelevää henkilöä. Suurin osa osallistujista tuli Yhdysvalloista, mutta joukossa oli kauempaa tulleita arkistotyöntekijöitä myös Kanadasta, Etelä-Afrikasta ja Ruotsista. Kurssin opettajina toimivat Jared Lyle ja Mary Vardigan ICPSR:stä sekä Ron Nakao Stanford Universitystä ja Jake Carlson Purdue Universitystä.

Kunkin päivän ohjelma oli rakennettu oman teeman ympärille. Päivittäisiä teemoja olivat tutkimusaineistojen elinkaari, arkistointipolitiikat, aineiston käsittely, aineistojen tietoturvallinen säilytys sekä jatkokäyttö. Kunkin päivän pääpuhuja oli kyseiseen teemaan erikoistunut asiantuntija. Luentojen lisäksi kurssi sisälsi paljon ryhmätöinä tehtyjä harjoituksia. Virallisen ohjelman ulkopuolella kurssin sisältöön kuului vierailu läheisessä Clarkin kirjastossa, jossa meille esiteltiin esimerkiksi kartta-aineistojen digitointia.

Kurssilla tutustuimme muun muassa erilaisiin teknisiin työkaluihin, jotka auttavat tutkimusaineistojen kuvailujen laatimisessa ja metadatan tallentamisessa. Opimme myös kuinka toimii pitkälle automatisoitu aineistojen talletusjärjestelmä, jossa tutkija voi luovuttaa tutkimusaineistonsa arkistoon suoraan verkossa. Tulevaisuudessa, kun rahoittajat uudistavat data-politiikkaansa ja arkistointivelvoitteet lisääntyvät myös Suomessa, vastaavaan järjestelmään siirtyminen on mitä todennäköisimmin edessä myös Yhteiskuntatieteellisessä tietoarkistossa.

Kokonaisuudessaan osallistuminen ICPSR:n kesäkurssille oli kaikin puolin hieno ja opettavainen kokemus. Opimme paljon ICPSR:n omista arkistointikäytännöistä ja aineistonkäsittelyntavoista. Lisäksi tutustuimme laajalti muihin mahdollisuuksiin käsitellä arkistoitavia tutkimusaineistoja ja saattaa niitä jatkokäyttäjien ulottuville. Uskallankin suositella nyt toista kertaa järjestettyä kurssia kaikille, jotka työskentelevät tutkimusaineistojen arkistoinnin parissa.

Lisätietoja: ICPSR:n kesäkurssien verkkosivusto.

Jarkko Päivärinta
tutkimusamanuenssi
etunimi.sukunimi [at] uta.fi