Tag Archives: data-alan ammattilaiset

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Laadulliset aineistot saivat IASSIST-konferenssissa aiempaa enemmän huomiota

IASSIST (International Association of Social Science Information Service & Technology) on yhteiskuntatieteellistä tutkimusta tukevien yksiköiden, kuten tietoarkistojen ja datakirjastojen, työntekijöiden kansainvälinen järjestö. Sen tärkein toimintamuoto on vuosittain järjestettävä kansainvälinen konferenssi. Tänä vuonna konferenssi järjestettiin Yhdysvaltojen Minneapolisissa kesäkuun ensimmäisellä viikolla. Konferenssiin osallistui myös neljä tietoarkistolaista.

Neljä päivää kestänyt konferenssi tarjosi runsaasti kiinnostavia aihepiiriin liittyviä luentoja ja työpajoja. Työpajat oli sijoitettu tapahtuman ensimmäiselle päivälle tiistaille. Loput kolme päivää oli pyhitetty luennoille ja paneelikeskusteluille. Kymmenestä valittavana olleesta työpajasta osallistuin itse kahteen, jotka molemmat liittyivät laadullisten aineistojen käsittelyyn. Perinteisesti laadulliset aineistot ovat saaneet IASSIST-konferensseissa selvästi kvantitatiivisia sisariaan vähemmän näkyvyyttä, joten kaksi erityisesti kvalitatiivisiin aineistoihin keskittyvää työpajaa olivat tervetullut uudistus.

Työpajoista ensimmäisessä tutustuttiin laadullisten aineistojen analysointityökaluun NVivoon (Using NVivo 10 for Qualitative Data Analysis). Vaikka työkalun perusajatus olikin monelle osallistujalle jo ennestään tuttu, sai kurssilta hyviä vinkkejä NVivon erilaisista käyttömahdollisuuksista. Työpajassa NVivoa lähestyttiin nimenomaan käytännön tasolla. Jokainen osallistuja sai koodata testiaineistoja ja kokeilla ohjelman tarjoamia työkaluja aineistojen analysoinnin helpottamiseksi.

Toinen työpaja käsitteli laadullisten aineistojen arkistoinnin ja jatkokäytön erityispiirteitä (Managing and Sharing Qualitative Data). Tutun aihepiirin teki työpajassa kiinnostavaksi muun muassa se, että sen järjesti yhdysvaltalaiseen Syracusen yliopistoon vasta hiljattain perustettu laadullisten arkistointiin erikoistunut Qualitative Data Repository (QDR).

Työpajan keskusteluissa sain huomata, että laadullisten aineistojen arkistoimisen haasteet ovat samoja maasta ja maanosasta riippumatta. Nämä haasteet liittyvät usein esimerkiksi tutkimuseettisiin ja tekijänoikeuskysymyksiin, arkistointia hankaloittavaan lainsäädäntöön sekä tutkijoiden haluttomuuteen luovuttaa keräämänsä, ja usein kovin henkilökohtaisina pitämänsä, tutkimusaineistot jatkokäyttöön. Kävikin varsin selväksi, että niin esimerkiksi Yhdysvaltojen, Euroopan kuin Afrikankin data-arkistoissa arkistotyöntekijät saavat vakuutella aineistoja kerääviä tutkijoita arkistoinnin hyödyistä ja hälventää aineistojen arkistointiin liittyviä epäluuloja.

Positiivisena muutoksena työpajan osallistujat kertoivat havainneensa sen, että kun aikaisemmin tutkijat tulivat ensimmäisen kerran kysymään arkistointiin liittyviä neuvoja vasta aineistot kerättyään, ottavat he nykyään arkistointimahdollisuuden huomioon yhä useammin jo aineistonhallintasuunnitelmaa laatiessaan. Tämä mahdollistaa sen, että tutkittavilta voidaan pyytää asianmukainen suostumus aineiston arkistointiin jo aineistoa kerättäessä.

IASSISTin varsinaiset luentosessiot oli jaettu teemansa perusteella kolmeen eri ryhmään. Tämä auttoi runsaudenpulasta kärsiviä konferenssiosallistujia valitsemaan monista päällekkäisistä sessioista itselle sopivimmat sen perusteella, kiinnostivatko häntä aineistonhallintaan liittyvät kysymykset, aineistopalvelujen ammatillinen kehittäminen vai datainfrastruktuuri ja -sovellukset. Itse osallistuin pääasiassa kahden ensimmäisen ryhmän luentosessioihin.

Luennot vahvistivat jo työpajassa tekemääni havaintoa siitä, että tutkimusaineistojen arkistointiin liittyvät kysymykset ovat pitkälti samanlaisia maasta ja arkistosta riippumatta. IASSIST tarjoaakin hienon tilaisuuden keskustella yhteisistä haasteista ja kehityssuunnista eri maista tulevien saman alan asiantuntijoiden kanssa. Samalla se tarjoaa vuosittain hyvän katsauksen siitä, mihin suuntaan eri maiden data-arkistot ovat kehittäneet toimintaansa ja palvelujansa edellisen vuoden aikana.

Ammatillisen verkostoitumismahdollisuuden lisäämiseksi IASSIST-konferenssiin kuuluu myös vapaamuotoisempaa ohjelmaa, kuten perinteinen ensimmäisen konferenssipäivän iltavastaanotto. Tällä kertaa vastaanotto järjestettiin Frank Gehryn suunnittelemassa upeassa Weisman Art Museumissa. Vastaanoton ohella perinteisesti yksi IASSISTin odotetuimpia tilaisuuksia varsinaisen konferenssiohjelman ulkopuolella on torstai-illan juhlaillallinen, jossa kansainvälisiä arkistokuulumisia voi vaihtaa hyvän ruoan ja juoman parissa.

IASSIST tarjosi siis jälleen kerran kattavan paketin tutkimusaineistojen arkistointiin ja jatkokäyttöön liittyviä näkökulmia. Seuraavan kerran IASSIST järjestetään Norjan Bergenissä touko-kesäkuun vaihteessa vuonna 2016. Osallistumista voin suositella kaikille tutkimusaineistojen arkistoinnin parissa työskenteleville, tieteenalaan katsomatta.

Lisätietoa:
» IASSIST
» IASSIST 2015 -konferenssi
» NVivo
» Qualitative Data Repository

Jarkko Päivärinta
tietopalveluasiantuntija
etunimi.sukunimi [at] uta.fi

Laadulliset aineistot saivat IASSIST-konferenssissa aiempaa enemmän huomiota

IASSIST (International Association of Social Science Information Service & Technology) on yhteiskuntatieteellistä tutkimusta tukevien yksiköiden, kuten tietoarkistojen ja datakirjastojen, työntekijöiden kansainvälinen järjestö. Sen tärkein toimintamuoto on vuosittain järjestettävä kansainvälinen konferenssi. Tänä vuonna konferenssi järjestettiin Yhdysvaltojen Minneapolisissa kesäkuun ensimmäisellä viikolla. Konferenssiin osallistui myös neljä tietoarkistolaista.

Neljä päivää kestänyt konferenssi tarjosi runsaasti kiinnostavia aihepiiriin liittyviä luentoja ja työpajoja. Työpajat oli sijoitettu tapahtuman ensimmäiselle päivälle tiistaille. Loput kolme päivää oli pyhitetty luennoille ja paneelikeskusteluille. Kymmenestä valittavana olleesta työpajasta osallistuin itse kahteen, jotka molemmat liittyivät laadullisten aineistojen käsittelyyn. Perinteisesti laadulliset aineistot ovat saaneet IASSIST-konferensseissa selvästi kvantitatiivisia sisariaan vähemmän näkyvyyttä, joten kaksi erityisesti kvalitatiivisiin aineistoihin keskittyvää työpajaa olivat tervetullut uudistus.

Työpajoista ensimmäisessä tutustuttiin laadullisten aineistojen analysointityökaluun NVivoon (Using NVivo 10 for Qualitative Data Analysis). Vaikka työkalun perusajatus olikin monelle osallistujalle jo ennestään tuttu, sai kurssilta hyviä vinkkejä NVivon erilaisista käyttömahdollisuuksista. Työpajassa NVivoa lähestyttiin nimenomaan käytännön tasolla. Jokainen osallistuja sai koodata testiaineistoja ja kokeilla ohjelman tarjoamia työkaluja aineistojen analysoinnin helpottamiseksi.

Toinen työpaja käsitteli laadullisten aineistojen arkistoinnin ja jatkokäytön erityispiirteitä (Managing and Sharing Qualitative Data). Tutun aihepiirin teki työpajassa kiinnostavaksi muun muassa se, että sen järjesti yhdysvaltalaiseen Syracusen yliopistoon vasta hiljattain perustettu laadullisten arkistointiin erikoistunut Qualitative Data Repository (QDR).

Työpajan keskusteluissa sain huomata, että laadullisten aineistojen arkistoimisen haasteet ovat samoja maasta ja maanosasta riippumatta. Nämä haasteet liittyvät usein esimerkiksi tutkimuseettisiin ja tekijänoikeuskysymyksiin, arkistointia hankaloittavaan lainsäädäntöön sekä tutkijoiden haluttomuuteen luovuttaa keräämänsä, ja usein kovin henkilökohtaisina pitämänsä, tutkimusaineistot jatkokäyttöön. Kävikin varsin selväksi, että niin esimerkiksi Yhdysvaltojen, Euroopan kuin Afrikankin data-arkistoissa arkistotyöntekijät saavat vakuutella aineistoja kerääviä tutkijoita arkistoinnin hyödyistä ja hälventää aineistojen arkistointiin liittyviä epäluuloja.

Positiivisena muutoksena työpajan osallistujat kertoivat havainneensa sen, että kun aikaisemmin tutkijat tulivat ensimmäisen kerran kysymään arkistointiin liittyviä neuvoja vasta aineistot kerättyään, ottavat he nykyään arkistointimahdollisuuden huomioon yhä useammin jo aineistonhallintasuunnitelmaa laatiessaan. Tämä mahdollistaa sen, että tutkittavilta voidaan pyytää asianmukainen suostumus aineiston arkistointiin jo aineistoa kerättäessä.

IASSISTin varsinaiset luentosessiot oli jaettu teemansa perusteella kolmeen eri ryhmään. Tämä auttoi runsaudenpulasta kärsiviä konferenssiosallistujia valitsemaan monista päällekkäisistä sessioista itselle sopivimmat sen perusteella, kiinnostivatko häntä aineistonhallintaan liittyvät kysymykset, aineistopalvelujen ammatillinen kehittäminen vai datainfrastruktuuri ja -sovellukset. Itse osallistuin pääasiassa kahden ensimmäisen ryhmän luentosessioihin.

Luennot vahvistivat jo työpajassa tekemääni havaintoa siitä, että tutkimusaineistojen arkistointiin liittyvät kysymykset ovat pitkälti samanlaisia maasta ja arkistosta riippumatta. IASSIST tarjoaakin hienon tilaisuuden keskustella yhteisistä haasteista ja kehityssuunnista eri maista tulevien saman alan asiantuntijoiden kanssa. Samalla se tarjoaa vuosittain hyvän katsauksen siitä, mihin suuntaan eri maiden data-arkistot ovat kehittäneet toimintaansa ja palvelujansa edellisen vuoden aikana.

Ammatillisen verkostoitumismahdollisuuden lisäämiseksi IASSIST-konferenssiin kuuluu myös vapaamuotoisempaa ohjelmaa, kuten perinteinen ensimmäisen konferenssipäivän iltavastaanotto. Tällä kertaa vastaanotto järjestettiin Frank Gehryn suunnittelemassa upeassa Weisman Art Museumissa. Vastaanoton ohella perinteisesti yksi IASSISTin odotetuimpia tilaisuuksia varsinaisen konferenssiohjelman ulkopuolella on torstai-illan juhlaillallinen, jossa kansainvälisiä arkistokuulumisia voi vaihtaa hyvän ruoan ja juoman parissa.

IASSIST tarjosi siis jälleen kerran kattavan paketin tutkimusaineistojen arkistointiin ja jatkokäyttöön liittyviä näkökulmia. Seuraavan kerran IASSIST järjestetään Norjan Bergenissä touko-kesäkuun vaihteessa vuonna 2016. Osallistumista voin suositella kaikille tutkimusaineistojen arkistoinnin parissa työskenteleville, tieteenalaan katsomatta.

Lisätietoa:
» IASSIST
» IASSIST 2015 -konferenssi
» NVivo
» Qualitative Data Repository

Jarkko Päivärinta
tietopalveluasiantuntija
etunimi.sukunimi [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Tutkimusdatan hallinnan asiantuntijapalvelut edellyttävät koulutuksen vahvistamista

Tietoarkisto järjesti joulukuun 2014 alussa seminaarin erityisesti kirjastoasiantuntijoille. Otsikkona oli Avoin tutkimusdata ja aineistonhallinta ihmistieteissä. Päivän tavoitteita olivat yleiskuva tutkimusrahoittajien ja -organisaatioiden tutkimusdatapolitiikoista Suomessa sekä perehtyminen tutkimusaineistojen hallintaan ja sen valtakunnallisiin tuki-infrastruktuureihin.

Kiinnostusta piisasi ja keskustelua heräsi. Onhan akateemisilla kirjastoilla jo orastava rooli myös datanhallinnan tietopalveluissa. Esimerkiksi Helsingin yliopiston tulevan tutkimusdatapolitiikan toimeenpanosuunnitelmissa yliopistokirjastolle on kaavailtu keskeisiä tehtäviä.

Väkeä tuli seminaariin mukaan hyvin eri yliopistoista ja paikalla oli kuutisenkymmentä asiantuntijaa. Uskoakseni osallistujat myös saivat mitä olivat tulleet hakemaan. Seminaaritallenteisiin ja esitysten dioihin voi tutustua seminaarisivustolla.

Jatkan tässä kirjoituksessa pohdintaa datapalvelualan koulutustarpeista ja -mahdollisuuksista, joista keskusteltiin seminaarin päättäneessä paneelissa. Näkökannoissa korostuivat sekä tutkimusdatapalvelualan täydennyskoulutuksen että alan tutkintokoulutuksen vahvistamistarpeet.

Millaiset ovat tutkimusdatan hallinnan asiantuntijoiden koulutustarpeiden peruslähtökohdat? Alan koulutuksen sisällöt, tarjonnan kohdeyleisöt sekä vastuut ja työnjako ovat sidoksissa etenkin siihen, miten tutkimusdatan hallinta ja keskeiset tietopalvelut järjestetään eri organisaatioissa ja mikä on valtakunnallinen työnjako. Tässä on tilaa useille toimijoille – sekä palvelujen tuottamisessa että osaamista vahvistavassa koulutuksessa. Luultavasti datanhallinnan tukipalvelumallit tulevat kehittymään ajan mittaan ja vaihtelemaan organisaatioittain.

Yksi toimivimmista on malli, jossa valtakunnalliset tukipalvelut (Tietoarkisto, CSC, ja muut valtakunnallisesti keskitetyt toimijat) tarjoavat suurelta osin tutkimusdatan dokumentointi-, arkistointi-, pitkäaikaissäilytys- ja jatkokäyttöpalvelut sekä täsmällistä erityisasiantuntemusta vaativia aineistohallintapalveluja. Jossakin määrin tällaisia palveluja tulevat luultavasti organisoimaan myös suurimmat valtion asiantuntijaorganisaatiot, ainakin itselleen.

Tutkimusympäristöjen muuttuessa tarvitaan paljon muutakin asiantuntemusta. On hyvä, jos tutkija löytää lähitietopalvelut paikan päältä, esimerkiksi juuri kirjastosta tai muista paikallisista tutkimuksen tukipalveluista. Sekä yliopistojen että muiden tutkimusorganisaatioiden informaatiopalveluissa on nyt ja tulevaisuudessa tarvetta tietopalvelualan asiantuntijoille, jotka erikoistuvat tutkimusdatan hallinnan, elinkaaren ja saatavuuden edistämisen tukeen.

Yhdysvalloissa tällaisia ammattilaisia kuvataan esimerkiksi ammattinimikeellä ”data librarian” tai yleiskäsitteellä ”research data professional”. He auttavat tutkijoita paikallistamaan tutkimusongelmiin soveltuvia, olemassa olevia aineistoja sekä osaavat jakaa tietoa tutkimusrahoittajien ja tutkimuksen julkaisijoiden ehdoista ja suosituksista tutkimusdatan avaamisen suhteen. Lisäksi heidän tulee olla luonnollisesti perillä oman tutkimusorganisaation käytännöistä datan hallinnassa tutkimusprojektien aikana ja tutkimusaineistojen avaamisessa hankkeiden päätyttyä. Tämä tehtävä korostuu organisaatiokohtaisten tutkimusdatapolitiikkojen yleistyessä.

Suomessa on akuutti tarve vahvistaa tutkimusdatapalveluihin erikoistuvien asiantuntijoiden koulutusta. Luonteva areena asian pikaiseen edistämiseen olisi yhteistyöfoorumi, jossa toimintaa voitaisiin suunnitella alustavasti ainakin alan valtakunnallisten tukipalvelujen ja kirjastoalan asiantuntijoiden ja heidän järjestöjensä ja verkostojensa voimin. Mukaan olisi hyvä saada myös informaatiotutkimuksen ja arkistoalan koulutuksen asiantuntijoita eri yliopistoista.

Missä tapaamme työpajan merkeissä vuonna 2015?

Lisätietoja:
» Seminaariesitysten diat ja AV-tallenteet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tutkimusdatan hallinnan asiantuntijapalvelut edellyttävät koulutuksen vahvistamista

Tietoarkisto järjesti joulukuun 2014 alussa seminaarin erityisesti kirjastoasiantuntijoille. Otsikkona oli Avoin tutkimusdata ja aineistonhallinta ihmistieteissä. Päivän tavoitteita olivat yleiskuva tutkimusrahoittajien ja -organisaatioiden tutkimusdatapolitiikoista Suomessa sekä perehtyminen tutkimusaineistojen hallintaan ja sen valtakunnallisiin tuki-infrastruktuureihin.

Kiinnostusta piisasi ja keskustelua heräsi. Onhan akateemisilla kirjastoilla jo orastava rooli myös datanhallinnan tietopalveluissa. Esimerkiksi Helsingin yliopiston tulevan tutkimusdatapolitiikan toimeenpanosuunnitelmissa yliopistokirjastolle on kaavailtu keskeisiä tehtäviä.

Väkeä tuli seminaariin mukaan hyvin eri yliopistoista ja paikalla oli kuutisenkymmentä asiantuntijaa. Uskoakseni osallistujat myös saivat mitä olivat tulleet hakemaan. Seminaaritallenteisiin ja esitysten dioihin voi tutustua seminaarisivustolla.

Jatkan tässä kirjoituksessa pohdintaa datapalvelualan koulutustarpeista ja -mahdollisuuksista, joista keskusteltiin seminaarin päättäneessä paneelissa. Näkökannoissa korostuivat sekä tutkimusdatapalvelualan täydennyskoulutuksen että alan tutkintokoulutuksen vahvistamistarpeet.

Millaiset ovat tutkimusdatan hallinnan asiantuntijoiden koulutustarpeiden peruslähtökohdat? Alan koulutuksen sisällöt, tarjonnan kohdeyleisöt sekä vastuut ja työnjako ovat sidoksissa etenkin siihen, miten tutkimusdatan hallinta ja keskeiset tietopalvelut järjestetään eri organisaatioissa ja mikä on valtakunnallinen työnjako. Tässä on tilaa useille toimijoille – sekä palvelujen tuottamisessa että osaamista vahvistavassa koulutuksessa. Luultavasti datanhallinnan tukipalvelumallit tulevat kehittymään ajan mittaan ja vaihtelemaan organisaatioittain.

Yksi toimivimmista on malli, jossa valtakunnalliset tukipalvelut (Tietoarkisto, CSC, ja muut valtakunnallisesti keskitetyt toimijat) tarjoavat suurelta osin tutkimusdatan dokumentointi-, arkistointi-, pitkäaikaissäilytys- ja jatkokäyttöpalvelut sekä täsmällistä erityisasiantuntemusta vaativia aineistohallintapalveluja. Jossakin määrin tällaisia palveluja tulevat luultavasti organisoimaan myös suurimmat valtion asiantuntijaorganisaatiot, ainakin itselleen.

Tutkimusympäristöjen muuttuessa tarvitaan paljon muutakin asiantuntemusta. On hyvä, jos tutkija löytää lähitietopalvelut paikan päältä, esimerkiksi juuri kirjastosta tai muista paikallisista tutkimuksen tukipalveluista. Sekä yliopistojen että muiden tutkimusorganisaatioiden informaatiopalveluissa on nyt ja tulevaisuudessa tarvetta tietopalvelualan asiantuntijoille, jotka erikoistuvat tutkimusdatan hallinnan, elinkaaren ja saatavuuden edistämisen tukeen.

Yhdysvalloissa tällaisia ammattilaisia kuvataan esimerkiksi ammattinimikeellä ”data librarian” tai yleiskäsitteellä ”research data professional”. He auttavat tutkijoita paikallistamaan tutkimusongelmiin soveltuvia, olemassa olevia aineistoja sekä osaavat jakaa tietoa tutkimusrahoittajien ja tutkimuksen julkaisijoiden ehdoista ja suosituksista tutkimusdatan avaamisen suhteen. Lisäksi heidän tulee olla luonnollisesti perillä oman tutkimusorganisaation käytännöistä datan hallinnassa tutkimusprojektien aikana ja tutkimusaineistojen avaamisessa hankkeiden päätyttyä. Tämä tehtävä korostuu organisaatiokohtaisten tutkimusdatapolitiikkojen yleistyessä.

Suomessa on akuutti tarve vahvistaa tutkimusdatapalveluihin erikoistuvien asiantuntijoiden koulutusta. Luonteva areena asian pikaiseen edistämiseen olisi yhteistyöfoorumi, jossa toimintaa voitaisiin suunnitella alustavasti ainakin alan valtakunnallisten tukipalvelujen ja kirjastoalan asiantuntijoiden ja heidän järjestöjensä ja verkostojensa voimin. Mukaan olisi hyvä saada myös informaatiotutkimuksen ja arkistoalan koulutuksen asiantuntijoita eri yliopistoista.

Missä tapaamme työpajan merkeissä vuonna 2015?

Lisätietoja:
» Seminaariesitysten diat ja AV-tallenteet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi