Tag Archives: tutkimusaineistot

Data Service Portal Aila: accessibility and practicality for non-Finnish speakers

The Finnish Social Science Data Archive (FSD) is one of the most important national resources for the collection and storing of social research data. Among the many services they offer, they aim to make research data available to everyone, free of char…

Data Service Portal Aila: accessibility and practicality for non-Finnish speakers

The Finnish Social Science Data Archive (FSD) is one of the most important national resources for the collection and storing of social research data. Among the many services they offer, they aim to make research data available to everyone, free of char…

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Suomalaisen tutkimuksen asema on varmistettava!

Tutkimus on ottamassa aimo harppauksen kohti tiedon entistä nopeampaa kertymistä ja tehokkaampaa tutkimusrahoituksen käyttöä. Avoin julkaiseminen saattaa tutkimusryhmien tulokset aiempaa nopeammin muiden tutkijoiden käyttöön. Tutkimusaineistojen avaaminen tuo mukanaan vielä suuremman muutoksen: se mahdollistaa tutkimusaineistojen monipuolisen käytön useilla tieteenaloilla, lisää poikkitieteellistä tutkimusta ja vähentää aineistojen kertakäyttöisyyttä sekä päällekkäisen tiedon keruuta.

Avoin julkaiseminen ja tutkimusaineistojen avaaminen ovatkin saaneet taakseen suuren joukon valtioita, mukaan lukien Suomen, EU:n tutkimussiiven ja suuren joukon kansainvälisiä tiedelehtiä. Avoimuuden kannattajien joukko myös kasvaa koko ajan.

EU:n tietosuoja-asetus määrittelee tutkittavien tietosuojan

Tutkimusaineistojen avaaminen muun tiedeyhteisön käyttöön ei kuitenkaan voi tapahtua ilman tarkkaa harkintaa. Erityisesti huolenaiheena ovat tutkittavien tietosuoja ja se, miten taataan, että yksilöllä on määräysvalta hänestä kerättyjen tietojen käyttämiseen.

EU:n uusi tietosuoja-asetus vastaa edellä mainittuihin huolenaiheisiin. Siinä on määritelty tarkkaan tutkittavilta kerättävän suostumuksen ja informoinnin muoto sekä se, mitä ihmisiä koskevaa tietoa saa käyttää tutkimuksessa ja millä ehdoin.

Tässä vaiheessa lukijaa kenties kummastuttaa, mikä tilanteessa sitten on ongelma. Jos asetus on valmis ja se tulee voimaan sellaisenaan ilman ratifioimisvaatimusta jäsenvaltioilta, eikö asia ole selvä?

Kansallinen ohjeistus asetuksen tulkintaan puuttuu

Tietosuoja-asetuksessa, niin kuin kaikissa lakiteksteissä, ongelmana on kuitenkin pykälien tulkinta. Vaikka asetus sisältää pitkän johdanto-osan, jossa selvitetään mitä sen säätäjät ovat artikloita kirjoittaessansa tarkoittaneet, tulkinnanvaraa jää silti. Lisäksi monessa kohtaa asetusta on teksti, jossa on kirjoitettu, että kansallisessa lainsäädännössä on mahdollisuus säätää tarkemmista vaatimuksista.

Tutkimuksen aseman ongelmallisuus astuu esiin tässä: Meillä ei ole vielä kansallista ohjeistusta siitä, miten asetusta pitää tulkita tutkimuskontekstissa. Vielä vähemmän meillä on tietoa siitä, aiotaanko asetuksen kansallista säätelyvaraa käyttää tiukentavaan suuntaan ja jos, kuinka paljon tiukempaan.

Tutkimuksen tekeminen vaatii paljon aikaa ja suunnittelua. Asetus tulee voimaan kahden vuoden kuluttua. Tuolloin käytettäviä tutkimusaineistoja ollaan joko keräämässä nyt tai niiden keräämistä suunnitellaan parhaillaan. Jotta asetusta päästään noudattamaan 2018, sen tulkinnan pitäisi olla tiedossa nyt, kun tutkittavilta on mahdollisuus ilman suuria lisäkustannuksia hankkia uuden asetuksen mukainen informoitu suostumus. Lääketieteellistä tutkimusta ei saa aloittaa ennen kuin se on saanut eettiseltä toimikunnalta myönteisen lausunnon. Eettisten toimikuntien täytyisikin pystyä antamaan eettiset lausunnot jo nyt uuden asetuksen mukaisesti. Sama koskee luonnollisesti myös muiden ihmistieteiden eettisiä toimikuntia.

Alueelliset toimikunnat tarvitsevat yhteiset pelisäännöt

Vallitsevassa tilanteessa eettisten toimikuntien on tehtävä ratkaisunsa tulkitsemalla asetusta mahdollisimman tiukasti, jotta asetuksen ehdot varmasti täyttyvät. Todennäköisesti myös alueellisten toimikuntien ratkaisut poikkeavat yhteisten pelisääntöjen puuttuessa toisistaan vielä entistä enemmän – alueellisia toimikuntia moitittiin jo nyt keskenään ristiriitaisista ratkaisuista työ- ja elinkeinoministeriön teettämässä selvityksessä terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä1.

Toimikuntien jäsenet tunnistavat ongelman ja ovat hämmentyneitä siitä, millaisia ratkaisuja heidän pitäisi tehdä. Heiltä kuitenkin puuttuvat välineet tehdä asialle mitään konkreettista. Tietoarkistoon on ollut yhteydessä useampi eettisten toimikuntien jäsen, mutta meidänkin on vastattava, ettemme valitettavasti vielä tiedä, miten asetusta pitäisi tulkita.

Epätietoisuus voi pudottaa Suomen kansainväliseltä pelikentältä

Ongelma on suurempi kuin nyt suunniteltavien tutkimusaineistojen tarkoituksenmukaista suppeampi käyttömahdollisuus ja sitä kautta resurssien alikäyttö. Kansainvälisesti tutkimusaineistojen avoimuus on saanut suuren kannattajakunnan. Kansainvälisistä tiedejulkaisuista huomattava osa (mm. PLOSone, useat BioMed Centralin jäsenlehdistä, PNAS, Nature ja NEJM) vaatii tutkimusjulkaisun ehdoksi datan saattamista avoimeksi. ICMJE:n ehdotuksen (International Committee of Medical Journal Editors) mukaan tulevaisuudessa hyväksytään julkaistavaksi vain sellaisten kliinisten tutkimusten tulokset, joiden taustalla oleva tutkimusaineisto avataan.

Jos ICMJE:n ehdotus menee läpi ja muut tiedejulkaisut kiristävät samalla omia avoimuusvaatimuksiaan, suomalaisten tutkijoiden mahdollisuus saada tutkimustuloksensa julkaistua heikkenevät olennaisesti. Kansainvälisiin rahoituksiin vaaditaan hyviä julkaisuja, joten myös niiden saaminen vaarantuu. Kansainvälisiin konsortioihin tuskin tulevaisuudessa kelpuutetaan tutkimusryhmiä, joiden aineistoja ei saa avata julkaisun yhteydessä samaan tapaan kuin muita aineistoja.

Tulkintalinjauksia tutkimukselle kaivataan

Oikeusministeriö on asettanut työryhmän käymään läpi suomalaisen lainsäädännön ongelmakohtia uuden tietosuoja-asetuksen näkökulmasta2. Alustavan arvion mukaan nykyisistä säännöksistä useassa sadassa ohjeistetaan henkilötietojen käsittelystä. Työryhmän on määrä tuottaa muutosehdotukset kesään 2017 mennessä. Myös sosiaali- ja terveysministeriössä työstetään uutta lakia, jossa säädetään sosiaali- ja terveydenhuollon asiakastietojen toissijaisesta käytöstä3. Näiden sekä uuden tietosuoja-asetuksen ansiosta tulevaisuudessa siis lainsäädäntömme voikin olla tutkimuksen osalta huomattavasti selkeämpi kuin se nyt on.

Tulkintakäytäntöjä kuitenkin tarvittaisiin jo ennen kuin tietosuoja-asetus astuu voimaan, jotta tutkijat voivat julkaista tuloksensa ja käyttää aineistojaan jatkotutkimuksissa. Salokanteleen4 mukaan suostumuksella saatujen aineistojen suostumusten on oltava asetuksen mukaisia asetuksen voimaan astuttua, jos henkilötietojen käsittelyä aiotaan jatkaa. Minkä sääntöjen pohjalta eettiset toimikunnat antavat lausuntonsa uusille tutkimuksille? Millä ehdoin Tietoarkisto, Kielipankki ja muut kansalliset tutkimusaineistojen arkistot voivat tallettaa aineistoja ja neuvoa tutkijoita pyytämään uusiin tutkimuksiin asetuksen mukaiset suostumukset?

Tarvitsemme selkeän linjauksen, joka ilmaisee lainsäätäjien näkemyksen siitä, mihin suuntaan Suomen tutkimuksessa tähdätään niin pian kuin mahdollista. Asetuksen edellyttämiä muutoksia käsittelevällä työryhmällä on mahdollisuus jakautua jaoksiin. Tulisiko tutkimusta varten asettaa oma jaos?

Tutkijoilta ja eettisiltä toimikunnilta vaaditaan päätöksiä nyt. Vuonna 2018 tietosuoja-asetuksen voimaan tullessa on monen tutkimuksen osalta myöhäistä.

Lähteet:
1 OwalGroup (2015). Selvitys terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä.
2 Oikeusministeriö, lakihankkeet. Henkilötietojen suojaa koskevan kansallisen lainsäädännön tarkistaminen.
3 Sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskevaa lainsäädäntöä valmisteleva työryhmä: Työryhmä- ja hankekuvaus ja Lainsäädäntöryhmän työskentelytila
4 Marjut Salokannel (2016). EU:n tietosuoja-asetus ja terveystietojen tutkimuskäyttö. Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa, seminaari 17.3.2016. (pdf)

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Suomalaisen tutkimuksen asema on varmistettava!

Tutkimus on ottamassa aimo harppauksen kohti tiedon entistä nopeampaa kertymistä ja tehokkaampaa tutkimusrahoituksen käyttöä. Avoin julkaiseminen saattaa tutkimusryhmien tulokset aiempaa nopeammin muiden tutkijoiden käyttöön. Tutkimusaineistojen avaaminen tuo mukanaan vielä suuremman muutoksen: se mahdollistaa tutkimusaineistojen monipuolisen käytön useilla tieteenaloilla, lisää poikkitieteellistä tutkimusta ja vähentää aineistojen kertakäyttöisyyttä sekä päällekkäisen tiedon keruuta.

Avoin julkaiseminen ja tutkimusaineistojen avaaminen ovatkin saaneet taakseen suuren joukon valtioita, mukaan lukien Suomen, EU:n tutkimussiiven ja suuren joukon kansainvälisiä tiedelehtiä. Avoimuuden kannattajien joukko myös kasvaa koko ajan.

EU:n tietosuoja-asetus määrittelee tutkittavien tietosuojan

Tutkimusaineistojen avaaminen muun tiedeyhteisön käyttöön ei kuitenkaan voi tapahtua ilman tarkkaa harkintaa. Erityisesti huolenaiheena ovat tutkittavien tietosuoja ja se, miten taataan, että yksilöllä on määräysvalta hänestä kerättyjen tietojen käyttämiseen.

EU:n uusi tietosuoja-asetus vastaa edellä mainittuihin huolenaiheisiin. Siinä on määritelty tarkkaan tutkittavilta kerättävän suostumuksen ja informoinnin muoto sekä se, mitä ihmisiä koskevaa tietoa saa käyttää tutkimuksessa ja millä ehdoin.

Tässä vaiheessa lukijaa kenties kummastuttaa, mikä tilanteessa sitten on ongelma. Jos asetus on valmis ja se tulee voimaan sellaisenaan ilman ratifioimisvaatimusta jäsenvaltioilta, eikö asia ole selvä?

Kansallinen ohjeistus asetuksen tulkintaan puuttuu

Tietosuoja-asetuksessa, niin kuin kaikissa lakiteksteissä, ongelmana on kuitenkin pykälien tulkinta. Vaikka asetus sisältää pitkän johdanto-osan, jossa selvitetään mitä sen säätäjät ovat artikloita kirjoittaessansa tarkoittaneet, tulkinnanvaraa jää silti. Lisäksi monessa kohtaa asetusta on teksti, jossa on kirjoitettu, että kansallisessa lainsäädännössä on mahdollisuus säätää tarkemmista vaatimuksista.

Tutkimuksen aseman ongelmallisuus astuu esiin tässä: Meillä ei ole vielä kansallista ohjeistusta siitä, miten asetusta pitää tulkita tutkimuskontekstissa. Vielä vähemmän meillä on tietoa siitä, aiotaanko asetuksen kansallista säätelyvaraa käyttää tiukentavaan suuntaan ja jos, kuinka paljon tiukempaan.

Tutkimuksen tekeminen vaatii paljon aikaa ja suunnittelua. Asetus tulee voimaan kahden vuoden kuluttua. Tuolloin käytettäviä tutkimusaineistoja ollaan joko keräämässä nyt tai niiden keräämistä suunnitellaan parhaillaan. Jotta asetusta päästään noudattamaan 2018, sen tulkinnan pitäisi olla tiedossa nyt, kun tutkittavilta on mahdollisuus ilman suuria lisäkustannuksia hankkia uuden asetuksen mukainen informoitu suostumus. Lääketieteellistä tutkimusta ei saa aloittaa ennen kuin se on saanut eettiseltä toimikunnalta myönteisen lausunnon. Eettisten toimikuntien täytyisikin pystyä antamaan eettiset lausunnot jo nyt uuden asetuksen mukaisesti. Sama koskee luonnollisesti myös muiden ihmistieteiden eettisiä toimikuntia.

Alueelliset toimikunnat tarvitsevat yhteiset pelisäännöt

Vallitsevassa tilanteessa eettisten toimikuntien on tehtävä ratkaisunsa tulkitsemalla asetusta mahdollisimman tiukasti, jotta asetuksen ehdot varmasti täyttyvät. Todennäköisesti myös alueellisten toimikuntien ratkaisut poikkeavat yhteisten pelisääntöjen puuttuessa toisistaan vielä entistä enemmän – alueellisia toimikuntia moitittiin jo nyt keskenään ristiriitaisista ratkaisuista työ- ja elinkeinoministeriön teettämässä selvityksessä terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä1.

Toimikuntien jäsenet tunnistavat ongelman ja ovat hämmentyneitä siitä, millaisia ratkaisuja heidän pitäisi tehdä. Heiltä kuitenkin puuttuvat välineet tehdä asialle mitään konkreettista. Tietoarkistoon on ollut yhteydessä useampi eettisten toimikuntien jäsen, mutta meidänkin on vastattava, ettemme valitettavasti vielä tiedä, miten asetusta pitäisi tulkita.

Epätietoisuus voi pudottaa Suomen kansainväliseltä pelikentältä

Ongelma on suurempi kuin nyt suunniteltavien tutkimusaineistojen tarkoituksenmukaista suppeampi käyttömahdollisuus ja sitä kautta resurssien alikäyttö. Kansainvälisesti tutkimusaineistojen avoimuus on saanut suuren kannattajakunnan. Kansainvälisistä tiedejulkaisuista huomattava osa (mm. PLOSone, useat BioMed Centralin jäsenlehdistä, PNAS, Nature ja NEJM) vaatii tutkimusjulkaisun ehdoksi datan saattamista avoimeksi. ICMJE:n ehdotuksen (International Committee of Medical Journal Editors) mukaan tulevaisuudessa hyväksytään julkaistavaksi vain sellaisten kliinisten tutkimusten tulokset, joiden taustalla oleva tutkimusaineisto avataan.

Jos ICMJE:n ehdotus menee läpi ja muut tiedejulkaisut kiristävät samalla omia avoimuusvaatimuksiaan, suomalaisten tutkijoiden mahdollisuus saada tutkimustuloksensa julkaistua heikkenevät olennaisesti. Kansainvälisiin rahoituksiin vaaditaan hyviä julkaisuja, joten myös niiden saaminen vaarantuu. Kansainvälisiin konsortioihin tuskin tulevaisuudessa kelpuutetaan tutkimusryhmiä, joiden aineistoja ei saa avata julkaisun yhteydessä samaan tapaan kuin muita aineistoja.

Tulkintalinjauksia tutkimukselle kaivataan

Oikeusministeriö on asettanut työryhmän käymään läpi suomalaisen lainsäädännön ongelmakohtia uuden tietosuoja-asetuksen näkökulmasta2. Alustavan arvion mukaan nykyisistä säännöksistä useassa sadassa ohjeistetaan henkilötietojen käsittelystä. Työryhmän on määrä tuottaa muutosehdotukset kesään 2017 mennessä. Myös sosiaali- ja terveysministeriössä työstetään uutta lakia, jossa säädetään sosiaali- ja terveydenhuollon asiakastietojen toissijaisesta käytöstä3. Näiden sekä uuden tietosuoja-asetuksen ansiosta tulevaisuudessa siis lainsäädäntömme voikin olla tutkimuksen osalta huomattavasti selkeämpi kuin se nyt on.

Tulkintakäytäntöjä kuitenkin tarvittaisiin jo ennen kuin tietosuoja-asetus astuu voimaan, jotta tutkijat voivat julkaista tuloksensa ja käyttää aineistojaan jatkotutkimuksissa. Salokanteleen4 mukaan suostumuksella saatujen aineistojen suostumusten on oltava asetuksen mukaisia asetuksen voimaan astuttua, jos henkilötietojen käsittelyä aiotaan jatkaa. Minkä sääntöjen pohjalta eettiset toimikunnat antavat lausuntonsa uusille tutkimuksille? Millä ehdoin Tietoarkisto, Kielipankki ja muut kansalliset tutkimusaineistojen arkistot voivat tallettaa aineistoja ja neuvoa tutkijoita pyytämään uusiin tutkimuksiin asetuksen mukaiset suostumukset?

Tarvitsemme selkeän linjauksen, joka ilmaisee lainsäätäjien näkemyksen siitä, mihin suuntaan Suomen tutkimuksessa tähdätään niin pian kuin mahdollista. Asetuksen edellyttämiä muutoksia käsittelevällä työryhmällä on mahdollisuus jakautua jaoksiin. Tulisiko tutkimusta varten asettaa oma jaos?

Tutkijoilta ja eettisiltä toimikunnilta vaaditaan päätöksiä nyt. Vuonna 2018 tietosuoja-asetuksen voimaan tullessa on monen tutkimuksen osalta myöhäistä.

Lähteet:
1 OwalGroup (2015). Selvitys terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä.
2 Oikeusministeriö, lakihankkeet. Henkilötietojen suojaa koskevan kansallisen lainsäädännön tarkistaminen.
3 Sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskevaa lainsäädäntöä valmisteleva työryhmä: Työryhmä- ja hankekuvaus ja Lainsäädäntöryhmän työskentelytila
4 Marjut Salokannel (2016). EU:n tietosuoja-asetus ja terveystietojen tutkimuskäyttö. Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa, seminaari 17.3.2016. (pdf)

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi