Tag Archives: aineistonhallinta

Tietoarkisto on FAIR

Avoimen tieteen piirissä on viimeisen vuoden aikana alettu puhua FAIR-periaatteista. Kiinnostuksen selittänee pitkälti EU:n Horisontti 2020 -ohjelma, joka painottaa tutkimusaineistojen hyvää hallintaa ja FAIR-periaatteita.

FAIR on lyhenne sanoista Findable, Accessible, Interoperable ja Re-usable. Suomeksi voitaisiin puhua tutkimusaineistojen löydettävyydestä, saavutettavuudesta, yhteentoimivuudesta ja uudelleenkäytettävyydestä – kaikki periaatteita, joita Tietoarkisto on edistänyt jo kohta kaksikymmentä vuotta ja vanhimmat yhteiskuntatieteelliset sisararkistomme (kuten brittien UKDS) jo puoli vuosisataa.

Vaikka kyse ei olekaan meille uudesta asiasta, FAIR-keskustelu on tarjonnut oivan herätteen tarkastella Tietoarkiston toimintaa hieman erilaisesta näkökulmasta. Yksi sysäys tarkastelullemme oli myös marraskuussa OpenAIRE2020-hankkeen järjestämä työpaja. Siellä FAIR-periaatteista keskusteltiin erilaisia tutkimuksen tukipalveluja vertailukohtana käyttäen. Tietoarkisto oli yksi mukana olleista palveluista.

Koska tarjoamme aineistojen arkistointi- ja avaamispalvelujen lisäksi neuvontaa ja ohjausta tutkimusdatan hallintaan (ks. tieteenala-asiantuntijamme Katja Fältin oiva katsaus olemassa oleviin aineistonhallinnan resursseihin ja palveluihin, onkin aiheellista ja reilua kysyä: Kuinka FAIR Tietoarkisto on?

Vastaukseni on, että Tietoarkisto on erittäin FAIR. Tässä tiivistetyt perustelut:

  • Tietoarkistoon arkistoidut aineistot on kuvailtu yksityiskohtaisesti. Metadata on vapaasti saatavilla ja hyödynnettävissä, vaikka datassa voi olla rajoituksia. Annamme aineistoille aina pysyvän tunnisteen. Aineistot ovat löydettävissä Tietoarkiston oman Aila-palveluportaalin kautta ja esimerkiksi myös kansallisten Finna- ja Etsin-palveluiden kautta.
  • Metadata on vapaasti saatavilla Ailan kautta sekä Tietoarkiston OAI-PMH-rajapinnasta. Rekisteröityneet käyttäjät voivat ladata dataa Ailasta. Aila hyödyntää HAKA-käyttäjätunnistusjärjestelmää.
  • Tietoarkisto käyttää aineistojen kuvailuun kansainvälistä DDI Codebook -kuvailuformaattia sekä useita kansainvälisiä sanastoja. Metadata sisältää myös viittauksia muuhun metadataan, dataan ja julkaisuihin. Data on saatavilla yhteiskuntatieteilijöiden yleisesti käyttämässä SPSS-formaatissa.
  • Aineistojen DDI Codebook -muotoinen metadata sisältää laajasti tietoa aineiston sisällöstä, tekijöistä, keruusta, muuttujista ja aineistoon viittaamisesta. Datan käyttöehdot ovat selkeät ja sisältyvät metadataan. Metadata on saatavilla CC-lisenssillä.

Tietoarkiston kannalta haasteellisin FAIR-periaate on yhteentoimivuus. FAIRin taustalla on idea koneellisesti saavutettavasta, käsiteltävästä ja tulkittavasta tiedosta. Se ei Tietoarkiston datan osalta toteudu täydellisesti, mutta mielestämme kuitenkin niin hyvin kuin on mahdollista ja tarkoituksenmukaista.

Marraskuun OpenAIRE2020-seminaarissa pohdittiinkin, mikä riittää siihen, että datan, organisaation tai palvelun voi sanoa olevan FAIR. Mitään yhtä vastausta tähän ei saatu – eikä mielestäni tarvitsekaan saada.

Esimerkiksi organisaatioiden toiminnan arviointiin on olemassa yksityiskohtaisia sertifikaatteja ja standardeja kuten OAIS, Data Seal of Approval ja ISO 16363. FAIR-periaatteet ovat sen sijaan iskevästi nimettyjä ja ilmaistuja yleisiä tavoitteita, ja ne toimivat sellaisina hyvin.

Tietoarkiston käytäntöjen FAIR-yhteensopivuus ei ollut yllätys, onhan meillä jo DSA-sertifikaatti. Aina on kuitenkin varaa parantaa, ja FAIR-periaatteet auttavat hahmottamaan, mitkä osa-alueet ovat vahvoja ja minkä osa-alueiden kehittämistä tulisi tutkiskella tarkemmin. Uskon, että FAIR-periaatteiden avulla on myös helppo herättää yleisempää keskustelua tutkimusaineistojen avaamisesta ja hallinnasta sekä niihin liittyvistä hyvistä käytännöistä.

Lisätietoa FAIR-periaatteista:
Wilkinson, Mark D. et al (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3, Article number 160018. http://dx.doi.org/10.1038/sdata.2016.18

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Mistä apua aineistonhallintaan?

Rahoittajien kiinnostus tutkimusaineistoihin ja niiden avaamiseen on tehnyt aineistonhallinnasta ajankohtaisempaa kuin koskaan. Yhä useampi suomalainen ja ulkomainen rahoittaja haluaa hakemuksen yhteyteen aineistonhallintasuunnitelman, jossa rahoituksen hakijan on määriteltävä millaista aineistoa on tarkoitus kerätä, miten sitä on tarkoitus käsitellä ja analysoida, miten tutkimuseettisiin seikkoihin, tekijänoikeuteen ja immateriaalioikeuksiin liittyvät näkökulmat huomioidaan, ja miten aineistoa on tarkoitus säilyttää tutkimuksen aikana ja sen jälkeen. Lisäksi suunnitelmissa pitää tyypillisesti määritellä, miten aineisto aiotaan saattaa avoimeksi muun tiedeyhteisön käyttöön. Jos tutkija ei aio avata aineistoaan, myös tämä ratkaisu on perusteltava.

Varsinkin tutkimusprosessin alussa villinä vellovan aineiston hallinta voi tuntua kurittoman kissalauman paimentamiselta. Paniikkiin ei kuitenkaan ole syytä, sillä tutkimusaineiston hallintaan löytyy näppärästi verkosta apuvälineitä käsikirjamaisista oppaista kursseihin.

Ensimmäisenä on luonnollisesti mainostettava Tietoarkiston omaa Aineistonhallinnan käsikirjaa. Käsikirja on informatiivinen tietopaketti, joka on jaoteltu osa-alueittain muun muassa aineistonhallinnan suunnitteluun, laadullisen ja määrällisen aineiston käsittelyyn ja kuvailuun sekä aineistojen säilyttämiseen. Ohjeistus on käytännönläheistä ja yksityiskohtaista, ja sitä on höystetty esimerkein sekä mallipohjin. Osiot voi lukea järjestyksessä tai yksitellen osa-alue kerrallaan. Jokaisen osion loppuun on koottu myös linkkilista, josta löytyy lisälukemista enemmän tietoa kaipaaville.

Kurssimaista tarjontaa etsiville on verkossa tarjolla useampiakin vaihtoehtoja. Ensisijaisesti opiskelijoille ja tutkijoille on suunnattu esimerkiksi Edinburghin yliopiston yhteydessä toimivan Edinan aineistonhallintakoulutus MANTRA, joka opastaa aineistonhallinnan saloihin interaktiivisten osioiden kautta. MANTRAssa aineistonhallintapaketti rakentuu tekstiosioista, videoista ja niihin liittyvistä tehtävistä, ja sisältöjä on mahdollista myös ladata omalle koneelle. Aivan kuten Aineistonhallinnan käsikirjassakin, voi MANTRAssa suunnistaa haluamansa osio kerrallaan, sillä kurssi ei pakota lineaariseen etenemiseen. Aineistonhallinnan opastuksen lisäksi aineiston käsittelyyn on tarjolla tutoriaaleja, joista saa käytännön vinkkejä sekä määrällisen että laadullisen, mutta myös geospatiaalisen aineiston käsittelyyn.

Courseran laaja-alaisessa kurssivalikoimassa on tutkimusaineistojen hallintaan ja jakamiseen opastava viisiviikkoinen Research Data Management and Sharing -kurssi, jonka tavoitteissa on varustaa osallistujat paremmilla aineistonhallinnan taidoilla sekä rohkaista aineistojen arkistointiin ja jakamiseen. Kurssi on koostettu viikkojen mukaan viiteen kokonaisuuteen, ja viikoittaiset opetusmateriaalit koostuvat muun muassa erilaisista harjoitustehtävistä, kokeista, lukupaketeista ja opetusvideoista. Asiakokonaisuudet painottavat aineistonhallinnan suunnittelua sekä aineiston käsittelyä, jakamista ja arkistointia. Kurssille on mahdollista osallistua ilmaiseksi; vain diplominhimoisilta peritään osallistumismaksu.

Hollantilainen Research Data Netherlands tarjoaa Essentials 4 Data Support kurssin, joka on suunniteltu ensisijaisesti aineistonhallinnan ammattilaisille eli henkilöille, joiden tehtävä on opastaa tutkijoita aineistoihin liittyvissä kysymyksissä. Kurssi opastaa aineistonhallinnan saloihin kolmella eri tavalla: netin kurssimateriaalia voi hyödyntää rekisteröitymättä palvelun käyttäjäksi, luomalla käyttäjäprofiilin tai osallistumalla online-osuuksien lisäksi läsnäoloa vaativiin osuuksiin. Viimeksi mainittu vaihtoehto on maksullinen, mutta netissä tapahtuvat osuudet ovat ilmaisia. Kurssi sopii kuitenkin hyvin myös tutkijoille, sillä se lähestyy aihetta aineiston elinkaarijaottelun avulla, jonka mukaisesti kokonaisuudet esitetään tutkimusvaiheittain.

Myös eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri CESSDA on kehittämässä omaa aineistonhallinnan moduuliaan. Tässä työssä on mukana myös Tietoarkisto. CESSDAn kehittelemä aineistonhallinnan kokonaisuus on vielä ideointivaiheessa, mutta sen tavoitteena on opastaa jo olemassa olevien aineistojen jatkokäytössä sekä tutkimusaineistojen hallinnassa, arkistoinnissa, säilyttämisessä ja jakamisessa parhaiden käytäntöjen mukaisesti. Pyrkimyksenä on noudattaa Euroopan komission Horizon 2020 -ohjelman Open Research Data -linjauksia, joissa painottuu FAIR-periaate. Sen mukaisesti Horizon 2020 -rahoituksen saajien tulee saattaa tutkimusaineistonsa löydettäväksi (findable), saavutettavaksi (accessible), yhteentoimivaksi (interoperable) ja uudelleen käytettäväksi (reusable). Ohjelman tavoite onkin, että tutkijat avaisivat tutkimusaineistonsa vuodesta 2017 eteenpäin oletusarvoisesti.

Aineistonhallinnan edessä ei siis tarvitse nosta käsiään pystyyn saati väännellä niitä epätoivoissaan. Pelkästään netistä löytyvän tarjonnan avulla on mahdollista saada kattava ohjeistus onnistuneeseen aineistonhallintaan. Ja toki Tietoarkiston asiakaspalvelu on aina valmiina auttamaan aineistonhallintaan liittyvissä kysymyksissä.

Linkkejä ja lisätietoa:
» Aineistonhallinnan käsikirja
» Edina: MANTRA
» RDNL: Essentials 4 Data Support
» Coursera MOOC: Research Data Management and Sharing
» DCC (2013): Checklist for a Data Management Plan (pdf)
» Horizon 2020:n Open Research Data (pdf)

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Mistä apua aineistonhallintaan?

Rahoittajien kiinnostus tutkimusaineistoihin ja niiden avaamiseen on tehnyt aineistonhallinnasta ajankohtaisempaa kuin koskaan. Yhä useampi suomalainen ja ulkomainen rahoittaja haluaa hakemuksen yhteyteen aineistonhallintasuunnitelman, jossa rahoituksen hakijan on määriteltävä millaista aineistoa on tarkoitus kerätä, miten sitä on tarkoitus käsitellä ja analysoida, miten tutkimuseettisiin seikkoihin, tekijänoikeuteen ja immateriaalioikeuksiin liittyvät näkökulmat huomioidaan, ja miten aineistoa on tarkoitus säilyttää tutkimuksen aikana ja sen jälkeen. Lisäksi suunnitelmissa pitää tyypillisesti määritellä, miten aineisto aiotaan saattaa avoimeksi muun tiedeyhteisön käyttöön. Jos tutkija ei aio avata aineistoaan, myös tämä ratkaisu on perusteltava.

Varsinkin tutkimusprosessin alussa villinä vellovan aineiston hallinta voi tuntua kurittoman kissalauman paimentamiselta. Paniikkiin ei kuitenkaan ole syytä, sillä tutkimusaineiston hallintaan löytyy näppärästi verkosta apuvälineitä käsikirjamaisista oppaista kursseihin.

Ensimmäisenä on luonnollisesti mainostettava Tietoarkiston omaa Aineistonhallinnan käsikirjaa. Käsikirja on informatiivinen tietopaketti, joka on jaoteltu osa-alueittain muun muassa aineistonhallinnan suunnitteluun, laadullisen ja määrällisen aineiston käsittelyyn ja kuvailuun sekä aineistojen säilyttämiseen. Ohjeistus on käytännönläheistä ja yksityiskohtaista, ja sitä on höystetty esimerkein sekä mallipohjin. Osiot voi lukea järjestyksessä tai yksitellen osa-alue kerrallaan. Jokaisen osion loppuun on koottu myös linkkilista, josta löytyy lisälukemista enemmän tietoa kaipaaville.

Kurssimaista tarjontaa etsiville on verkossa tarjolla useampiakin vaihtoehtoja. Ensisijaisesti opiskelijoille ja tutkijoille on suunnattu esimerkiksi Edinburghin yliopiston yhteydessä toimivan Edinan aineistonhallintakoulutus MANTRA, joka opastaa aineistonhallinnan saloihin interaktiivisten osioiden kautta. MANTRAssa aineistonhallintapaketti rakentuu tekstiosioista, videoista ja niihin liittyvistä tehtävistä, ja sisältöjä on mahdollista myös ladata omalle koneelle. Aivan kuten Aineistonhallinnan käsikirjassakin, voi MANTRAssa suunnistaa haluamansa osio kerrallaan, sillä kurssi ei pakota lineaariseen etenemiseen. Aineistonhallinnan opastuksen lisäksi aineiston käsittelyyn on tarjolla tutoriaaleja, joista saa käytännön vinkkejä sekä määrällisen että laadullisen, mutta myös geospatiaalisen aineiston käsittelyyn.

Courseran laaja-alaisessa kurssivalikoimassa on tutkimusaineistojen hallintaan ja jakamiseen opastava viisiviikkoinen Research Data Management and Sharing -kurssi, jonka tavoitteissa on varustaa osallistujat paremmilla aineistonhallinnan taidoilla sekä rohkaista aineistojen arkistointiin ja jakamiseen. Kurssi on koostettu viikkojen mukaan viiteen kokonaisuuteen, ja viikoittaiset opetusmateriaalit koostuvat muun muassa erilaisista harjoitustehtävistä, kokeista, lukupaketeista ja opetusvideoista. Asiakokonaisuudet painottavat aineistonhallinnan suunnittelua sekä aineiston käsittelyä, jakamista ja arkistointia. Kurssille on mahdollista osallistua ilmaiseksi; vain diplominhimoisilta peritään osallistumismaksu.

Hollantilainen Research Data Netherlands tarjoaa Essentials 4 Data Support kurssin, joka on suunniteltu ensisijaisesti aineistonhallinnan ammattilaisille eli henkilöille, joiden tehtävä on opastaa tutkijoita aineistoihin liittyvissä kysymyksissä. Kurssi opastaa aineistonhallinnan saloihin kolmella eri tavalla: netin kurssimateriaalia voi hyödyntää rekisteröitymättä palvelun käyttäjäksi, luomalla käyttäjäprofiilin tai osallistumalla online-osuuksien lisäksi läsnäoloa vaativiin osuuksiin. Viimeksi mainittu vaihtoehto on maksullinen, mutta netissä tapahtuvat osuudet ovat ilmaisia. Kurssi sopii kuitenkin hyvin myös tutkijoille, sillä se lähestyy aihetta aineiston elinkaarijaottelun avulla, jonka mukaisesti kokonaisuudet esitetään tutkimusvaiheittain.

Myös eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri CESSDA on kehittämässä omaa aineistonhallinnan moduuliaan. Tässä työssä on mukana myös Tietoarkisto. CESSDAn kehittelemä aineistonhallinnan kokonaisuus on vielä ideointivaiheessa, mutta sen tavoitteena on opastaa jo olemassa olevien aineistojen jatkokäytössä sekä tutkimusaineistojen hallinnassa, arkistoinnissa, säilyttämisessä ja jakamisessa parhaiden käytäntöjen mukaisesti. Pyrkimyksenä on noudattaa Euroopan komission Horizon 2020 -ohjelman Open Research Data -linjauksia, joissa painottuu FAIR-periaate. Sen mukaisesti Horizon 2020 -rahoituksen saajien tulee saattaa tutkimusaineistonsa löydettäväksi (findable), saavutettavaksi (accessible), yhteentoimivaksi (interoperable) ja uudelleen käytettäväksi (reusable). Ohjelman tavoite onkin, että tutkijat avaisivat tutkimusaineistonsa vuodesta 2017 eteenpäin oletusarvoisesti.

Aineistonhallinnan edessä ei siis tarvitse nosta käsiään pystyyn saati väännellä niitä epätoivoissaan. Pelkästään netistä löytyvän tarjonnan avulla on mahdollista saada kattava ohjeistus onnistuneeseen aineistonhallintaan. Ja toki Tietoarkiston asiakaspalvelu on aina valmiina auttamaan aineistonhallintaan liittyvissä kysymyksissä.

Linkkejä ja lisätietoa:
» Aineistonhallinnan käsikirja
» Edina: MANTRA
» RDNL: Essentials 4 Data Support
» Coursera MOOC: Research Data Management and Sharing
» DCC (2013): Checklist for a Data Management Plan (pdf)
» Horizon 2020:n Open Research Data (pdf)

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Datapolitiikat ohjaavat avaamaan tutkimusaineistot vastuullisesti

Tampereen yliopisto julkaisi datapolitiikkansa lokakuun lopussa otsikolla Avoin tiede Tampereen yliopistossa: julkaisu- ja datapolitiikka. Asiakirja koskee sähköisiä julkaisuja ja tutkimusdataa. Sekä julkaisupolitiikassa että datapolitiikassa on tavoitteena saada tutkimustieto avoimeksi ja helposti löydettäväksi. Lisäksi politiikkapaperi kertoo, mitä avoimuutta tukevia palveluita yliopistoyhteisön jäsenille on tarjolla.

Tampereen yliopisto ei ole datapolitiikan teossa aivan viimeisenä liikkeellä, mutta turhaa kiirettäkään ei ole pidetty. Osasyynä rauhalliseen tahtiin on voinut olla se, että on ajateltu Tietoarkiston hoitavan homman jo käytännössä.

Erityisesti viimeksi kuluneen vuoden aikana Suomessa on julkaistu useita datapolitiikkoja. Kun Tietoarkiston väistyvä johtaja Sami Borg selvitti toissa syksynä yliopistojen tilannetta, vain Jyväskylän yliopistossa oli ”tutkimuksen tietoaineistojen hallinnan periaatteet”. Nyt näitä periaatteita tai datapolitiikkoja on paitsi useissa ylipistoissa myös muissa organisaatioissa. Myös rahoittajien vaatimukset aineistonhallintasuunnitelmien laatimiseksi ja aineistojen avaamiseksi ilmentävät rahoittajien datapolitiikkoja, olipa erillistä politiikkadokumenttia olemassa tai ei.

Datapolitiikan puuttuminen ei ole onneksi estänyt Tampereen yliopiston tutkijoita tallentamasta aineistoja Tietoarkistoon. Päinvastoin he ovat olleet muiden yliopistojen tutkijoita innokkaampia arkistoijia. Paljon kiinnostavia aineistoja on kuitenkin jäänyt avaamatta, niin Tampereella kuin muissakin tutkimusorganisaatioissa. Niinpä meille tietoarkistolaisille linjaus, jossa suoraan kehotetaan tallentamaan aineistot ensi sijassa Tietoarkistoon, on tervetullut apuväline oman yliopiston aineistojen hankinnassa.

Tampereen yliopiston datapolitiikka lupaa, että Tietoarkisto tukee tutkimusaineistojen vastuullista avaamista ja huolehtii tallennettujen aineistojen pitkäaikaissaatavuudesta. Lisäksi Tietoarkiston luvataan välittävän aineistojen kuvailutiedot useisiin kansallisiin ja kansainvälisiin tietokantoihin. Politiikka viittaa myös Tietoarkiston Aineistonhallinnan käsikirjaan, joka opastaa hyvään datanhallintaan ja tunnisteiden poistoon. Tietoarkisto voi auttaa anonymisoinnissa, kun data tallennetaan Tietoarkistoon.

Tampereen yliopiston lisäksi Tietoarkistolla on ystäviä myös muissa suomalaisissa yliopistoissa. Tämä on käynyt selväksi. Vaikka niiden datapolitiikassa ei mainittaisi Tietoarkistoa, tarkemmassa ohjeistuksessa meihin yleensä jo viitataan, huhujen mukaan suullisessa neuvonnassa vielä useammin. Onkin hyvä muistaa, että Tampereen yliopiston avoimen tieteen linjauksissa mainitut Tietoarkiston palvelut koskevat kaikkien Suomen yliopistojen tutkijoita. Ja toki annamme neuvontaa myös muille mahdollisille asiakkaille ammattikorkeakouluissa ja tutkimuslaitoksissa – kunhan he ovat aikeissa tallentaa aineistojaan Tietoarkistoon.

Palvelulupauksessamme ei ole sinänsä mitään uutta. Tietoarkisto on tarjonnut palveluitaan jo lähes 20 vuotta. Ennen kuin Aineistonhallinnan käsikirja julkaistiin syksyllä 2008, vastaavaa neuvontaa sai asiakaspalvelustamme. Uutta on, että Tampereen yliopisto ja monet muut organisaatiot kehottavat tai jopa vaativat, että aineistot avataan ja suosittelevat juuri Tietoarkiston palveluita.

Toivon, että datapolitiikat eivät ole kuormitetuille tutkijoille vain yksi uusi ahdistava vaatimusten kokoelma. Ne eivät ole ratkaisu ongelmiin, joita tutkijat aineistojen avaamisessa kohtaavat, mutta ne kehottavat vahvasti ryhtymään ratkomaan mahdollisia ongelmia – ja hakemaan apua kokeneilta asiantuntijoilta. Enää aineistoja ei voi jättää avaamatta vain, koska se ei ole ollut tapana.

Tietoarkistolle, yliopistojen kirjastoille ja tutkimuspalveluille – kuka tai ketkä missäkin organisaatiossa käytännön toteuttamisesta vastaavatkaan – datapolitiikkojen julkaiseminen on vasta alkua. Pelkkä datapolitiikka ei muuta vielä mitään, vaan politiikka on jalkautettava, ja siihen me täällä Tampereella ryhdymme nyt.

Jyväskylässä ja Helsingissä datapolitiikan jalkauttamisesta on kokemusta viimeisen parin vuoden ajalta. Asiat edistyvät hitaasti, mutta ne edistyvät. Tietoarkistotyötä nyt noin 15 vuotta tehneenä olen kehityksestä suorastaan innoissani. Aineistojen avaaminen on nykyään kaikkien yhteinen juttu!

Tietoarkisto ja Tampereen yliopiston kirjasto järjestävät 9.11. Tampereella Kesytä aineistokaaos -iltapäiväseminaarin, jossa esittelen lyhyesti juuri julkaistua Tampereen yliopiston datapolitiikkaa. Iltapäivä tarjoaa myös käytännönläheistä tietoa siitä, miten hallita aineistoaan, ja millaisia palveluita tutkijan tueksi on tarjolla.

Lisätietoja
» Tampereen yliopiston julkaisu- ja datapolitiikka
» Avoin tiede ja tutkimus -hanke listaa organisaatioiden linjauksia ja ohjeistuksia
» Kesytä aineistokaaos -seminaari

Helena Laaksonen
informaatikko, varajohtaja
etunimi.sukunimi [at] uta.fi

Datapolitiikat ohjaavat avaamaan tutkimusaineistot vastuullisesti

Tampereen yliopisto julkaisi datapolitiikkansa lokakuun lopussa otsikolla Avoin tiede Tampereen yliopistossa: julkaisu- ja datapolitiikka. Asiakirja koskee sähköisiä julkaisuja ja tutkimusdataa. Sekä julkaisupolitiikassa että datapolitiikassa on tavoitteena saada tutkimustieto avoimeksi ja helposti löydettäväksi. Lisäksi politiikkapaperi kertoo, mitä avoimuutta tukevia palveluita yliopistoyhteisön jäsenille on tarjolla.

Tampereen yliopisto ei ole datapolitiikan teossa aivan viimeisenä liikkeellä, mutta turhaa kiirettäkään ei ole pidetty. Osasyynä rauhalliseen tahtiin on voinut olla se, että on ajateltu Tietoarkiston hoitavan homman jo käytännössä.

Erityisesti viimeksi kuluneen vuoden aikana Suomessa on julkaistu useita datapolitiikkoja. Kun Tietoarkiston väistyvä johtaja Sami Borg selvitti toissa syksynä yliopistojen tilannetta, vain Jyväskylän yliopistossa oli ”tutkimuksen tietoaineistojen hallinnan periaatteet”. Nyt näitä periaatteita tai datapolitiikkoja on paitsi useissa ylipistoissa myös muissa organisaatioissa. Myös rahoittajien vaatimukset aineistonhallintasuunnitelmien laatimiseksi ja aineistojen avaamiseksi ilmentävät rahoittajien datapolitiikkoja, olipa erillistä politiikkadokumenttia olemassa tai ei.

Datapolitiikan puuttuminen ei ole onneksi estänyt Tampereen yliopiston tutkijoita tallentamasta aineistoja Tietoarkistoon. Päinvastoin he ovat olleet muiden yliopistojen tutkijoita innokkaampia arkistoijia. Paljon kiinnostavia aineistoja on kuitenkin jäänyt avaamatta, niin Tampereella kuin muissakin tutkimusorganisaatioissa. Niinpä meille tietoarkistolaisille linjaus, jossa suoraan kehotetaan tallentamaan aineistot ensi sijassa Tietoarkistoon, on tervetullut apuväline oman yliopiston aineistojen hankinnassa.

Tampereen yliopiston datapolitiikka lupaa, että Tietoarkisto tukee tutkimusaineistojen vastuullista avaamista ja huolehtii tallennettujen aineistojen pitkäaikaissaatavuudesta. Lisäksi Tietoarkiston luvataan välittävän aineistojen kuvailutiedot useisiin kansallisiin ja kansainvälisiin tietokantoihin. Politiikka viittaa myös Tietoarkiston Aineistonhallinnan käsikirjaan, joka opastaa hyvään datanhallintaan ja tunnisteiden poistoon. Tietoarkisto voi auttaa anonymisoinnissa, kun data tallennetaan Tietoarkistoon.

Tampereen yliopiston lisäksi Tietoarkistolla on ystäviä myös muissa suomalaisissa yliopistoissa. Tämä on käynyt selväksi. Vaikka niiden datapolitiikassa ei mainittaisi Tietoarkistoa, tarkemmassa ohjeistuksessa meihin yleensä jo viitataan, huhujen mukaan suullisessa neuvonnassa vielä useammin. Onkin hyvä muistaa, että Tampereen yliopiston avoimen tieteen linjauksissa mainitut Tietoarkiston palvelut koskevat kaikkien Suomen yliopistojen tutkijoita. Ja toki annamme neuvontaa myös muille mahdollisille asiakkaille ammattikorkeakouluissa ja tutkimuslaitoksissa – kunhan he ovat aikeissa tallentaa aineistojaan Tietoarkistoon.

Palvelulupauksessamme ei ole sinänsä mitään uutta. Tietoarkisto on tarjonnut palveluitaan jo lähes 20 vuotta. Ennen kuin Aineistonhallinnan käsikirja julkaistiin syksyllä 2008, vastaavaa neuvontaa sai asiakaspalvelustamme. Uutta on, että Tampereen yliopisto ja monet muut organisaatiot kehottavat tai jopa vaativat, että aineistot avataan ja suosittelevat juuri Tietoarkiston palveluita.

Toivon, että datapolitiikat eivät ole kuormitetuille tutkijoille vain yksi uusi ahdistava vaatimusten kokoelma. Ne eivät ole ratkaisu ongelmiin, joita tutkijat aineistojen avaamisessa kohtaavat, mutta ne kehottavat vahvasti ryhtymään ratkomaan mahdollisia ongelmia – ja hakemaan apua kokeneilta asiantuntijoilta. Enää aineistoja ei voi jättää avaamatta vain, koska se ei ole ollut tapana.

Tietoarkistolle, yliopistojen kirjastoille ja tutkimuspalveluille – kuka tai ketkä missäkin organisaatiossa käytännön toteuttamisesta vastaavatkaan – datapolitiikkojen julkaiseminen on vasta alkua. Pelkkä datapolitiikka ei muuta vielä mitään, vaan politiikka on jalkautettava, ja siihen me täällä Tampereella ryhdymme nyt.

Jyväskylässä ja Helsingissä datapolitiikan jalkauttamisesta on kokemusta viimeisen parin vuoden ajalta. Asiat edistyvät hitaasti, mutta ne edistyvät. Tietoarkistotyötä nyt noin 15 vuotta tehneenä olen kehityksestä suorastaan innoissani. Aineistojen avaaminen on nykyään kaikkien yhteinen juttu!

Tietoarkisto ja Tampereen yliopiston kirjasto järjestävät 9.11. Tampereella Kesytä aineistokaaos -iltapäiväseminaarin, jossa esittelen lyhyesti juuri julkaistua Tampereen yliopiston datapolitiikkaa. Iltapäivä tarjoaa myös käytännönläheistä tietoa siitä, miten hallita aineistoaan, ja millaisia palveluita tutkijan tueksi on tarjolla.

Lisätietoja
» Tampereen yliopiston julkaisu- ja datapolitiikka
» Avoin tiede ja tutkimus -hanke listaa organisaatioiden linjauksia ja ohjeistuksia
» Kesytä aineistokaaos -seminaari

Helena Laaksonen
informaatikko, varajohtaja
etunimi.sukunimi [at] uta.fi

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkisto vei Länsi-Balkaniin osaamista laadullisten aineistojen arkistoinnista

Sain tilaisuuden vierailla Sloveniassa Ljubljanassa laadullisten aineistojen arkisto-osaajan roolissa. Kolmipäiväisen työpajan (9.–11.2.2016) tavoitteena oli perehtyä tutkimusaineistojen arkistointiin. Esitysten ohessa työpajassa käsiteltiin oikeita aineistoja, jotka on tuotettu RRPP-projektissa.

Työpajan osallistujat olivat Albaniasta, Kosovosta, Serbiasta, Makedoniasta, Montenegrosta ja Kroatiasta. Aineistojen kotimaat ja kielet olivat samat kuin osallistujien. Kouluttajia oli minun lisäkseni Slovenian ja Sveitsin tietoarkistoista.

Se että laadulliset aineistot olivat vieraskielisiä, tuotti omat pulmansa niistä keskustelemiseen. Apuna toimi Google-kääntäjä, jonka avulla minun oli mahdollista kurkistella erikielisten aineistojen sisältöihin myös englanniksi jo ennen työpajaa. Koneellisesti tuotetut pikakäännökset ovat tietysti epätarkkoja ja osin virheellisiä. Ne kuitenkin auttoivat oleellisesti arkistointia koskevissa keskusteluissa. Analyysiin Google-kääntäjällä tuotetut aineistot tuskin sopisivat täysin varauksitta.

Kulttuuriset ja historialliset erityispiirteet puolestaan tuovat eri maiden laadullisiin aineistoihin omat eettiset ja lainsäädännöllisetkin haasteensa. Etukäteen oletin, että niistä keskusteltaisiin eniten. Mutta toisin kävi. Olennaisimmat kysymykset arkistoinnin näkökulmasta olivat samat kuin meillä Suomessa: Onko aineistojen sisältämistä henkilöistä ja aineiston tuottamistilanteista riittävästi tietoa? Ovatko haastattelujen kysymykset tai ryhmäkeskustelujen teemat tallessa? Ovatko litteraatit yhdenmukaisia läpi koko aineiston? Mitä aineistojen käytöstä ja erityisesti jatkokäytöstä on sovittu tutkittavien kanssa? Miten laadullista aineistoa voi anonymisoida?

Niin Länsi-Balkanilla kuin meillä Suomessakin laadullisen aineiston arkistointi onnistuu parhaiten, kun ajatus aineiston säilyttämisestä jatkokäyttöä varten on ollut tutkijalla mielessä alusta saakka. Vaikka työpajassa käsiteltyjen aineistojen joukossa oli muutama tällainen valopilkku, harmillisen usein aineistoista puuttuivat tiedot tutkittavien suostumuksesta. Keskusteluissamme tulimme siihen tulokseen, että kirjallisten suostumusten ohella tai niiden sijaan olisi hyvä saada äänitallenteiden alkuun tallennetuksi tutkijan selostus aineiston käytöstä ja säilyttämisestä ja tutkittavien suostumus osallistua annetuin ehdoin. Näin tutkimussuostumukset olisivat mukana itse aineistotiedostoissa ja niistä tehdyissä litteraateissa.

Toisinaan tutkijalla oli kadonnut alkuperäinen haastattelurunko, ja muutamista aineistoista puuttui osa, kun tiedostoja oli hävinnyt tutkijan työkoneen vaihtamisen yhteydessä. Tällaiset riskit ovat mahdollisia kaikilla tutkijoilla maasta riippumatta. Olinkin iloinen voidessani esitellä Tietoarkiston aineistonhallinnan käsikirjaa, josta suurin osa on käännetty myös englanniksi.

Työpajan osallistujat suunnittelevat perustavansa tietoarkistoja omiin kotimaihinsa. Jo karttuneen tietotaidon saavutettavuus auttaa heitä siinä huomattavasti. CESSDA-arkistoista laadullisten aineistojen ylivertaisia osaajia ovat Ison-Britannian UKDA ja pienen Suomen Tietoarkisto.

Lisätietoa:
» SEEDS workshop in Ljubljana
» Aineistonhallinnan käsikirja
» Data Management Guidelines

Arja Kuula-Luumi
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi