Tag Archives: jatkokäyttö

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Itä-Aasian tietoarkistot kutsuvat yhteistyöhön

Tietoarkisto sai viime syksynä kutsun osallistua Japanin tietoarkiston SSJDA:n järjestämään seminaariin 12.–13. helmikuuta Tokiossa. Seminaari oli suunnattu Itä-Aasian arkistoille, mutta meidät kutsuttiin kertomaan Euroopan (ja Suomen) tämän hetkisestä tilanteesta nyt, kun Euroopan tietoarkistojen yhteinen EU-tutkimusinfrastruktuuri – CESSDA ERIC – on aloittamassa toimintaansa. Matkaan lähtivät arkiston johtaja Sami Borg ja minä.

Suomen tietoarkiston lisäksi seminaariin oli kutsuttu Korean tietoarkisto KOSSDA ja Taiwanin tietoarkisto SRDA. Lisäksi paikalla oli edustajia Soulin yliopistosta. Ohjelma oli tiivis. Ennen seminaarin alkua teimme tutustumiskäynnin SSJDA:n tiloihin. Varsinainen seminaari jakautui suljettuun, kutsutuille arkistoille tarkoitettuun osaan ja avoimeen osaan, johon kaikki kiinnostuneet Tokion yliopistolla olivat tervetulleita.

Oli mielenkiintoista havaita kuinka samanlaista arkistojen toiminta oli vaikka kaikkien organisaatiotausta oli erilainen. SSJDA on osa Tokion yliopiston yhteiskuntatieteellistä tutkimuskeskusta. Korean KOSSDAn taustalla on yksityinen säätiö. Taiwanin SRDA on osa Taiwanin kansallisen tutkimusakatemian Academia Sinican kulttuuri- ja yhteiskuntatieteiden alan tutkimuskeskusta. Suomen tietoarkisto puolestaan on opetus- ja kulttuuriministeriön Tampereen yliopistolle osoittama palvelutehtävä ja yliopiston erillisyksikkö.

Erilaisista taustoista huolimatta meitä kaikkia kuitenkin yhdistää se, että luovutamme aineistoja jatkokäyttöön oman kotiorganisaation ulkopuolelle. Aineistojen valmistelu arkistoitavaksi ja jatkokäyttöön tapahtui myös pääosin samojen periaatteiden mukaan, mutta aineistojen hankintatavat eroavat jonkin verran. Japanissa ja Taiwanissa osa aineistoista tulee suoraan isäntäorganisaation tutkijoilta ja osa hankitaan samaan tapaan kuin pääosa aineistoista meillä Suomessa: ottamalla yhteyttä suoraan tutkijoihin ja tutkimusorganisaatioihin. KOSSDAssa hankinta perustuu pitkälti eri organisaatioiden ja järjestöjen kanssa tehtyihin jäsenyyssopimuksiin. Lisäksi sen kumppanit toimittavat KOSSDAlle aineistoja selvästi enemmän kuin KOSSDA pystyy käsittelemään. Suomalaisen tietoarkistolaisen silmissä tämä vaikutti lähinnä positiiviselta ongelmalta.

Kaikki seminaariin osallistuneet arkistot toimittavat aineistoja oman kotimaansa ulkopuolelle. Myös suomalaiset tutkijat voivat saada esimerkiksi Japanin tietoarkiston aineistoja käyttöönsä. Kieli tosin saattaa muodostua ongelmaksi – kaikkea ei ole saatavilla englanniksi.

En itse ollut aiemmin käynyt Japanissa, joten seminaarin lisäksi kaikki muukin oli hyvin kiinnostavaa. Tokio on valtava kaupunki, ja on uskomatonta kuinka hyvin kaikki siellä toimii. Japanilaiset ovat kohteliaita ja avuliaita.

Tietoarkistojen kanssakäyminen on hyvin vilkasta. Eurooppalaisten arkistojen yhteistyön painopiste on kuitenkin Euroopassa ja eurooppalaisuus varmasti painottuu edelleen CESSDA ERICin myötä. Oli hyvin mielenkiintoista tavata myös aasialaisten tietoarkistojen edustajia ja kuulla näiden toiminnasta.

Matti Heinonen
ATK-erikoistutkija
etunimi.sukunimi [at] uta.fi

Itä-Aasian tietoarkistot kutsuvat yhteistyöhön

Tietoarkisto sai viime syksynä kutsun osallistua Japanin tietoarkiston SSJDA:n järjestämään seminaariin 12.–13. helmikuuta Tokiossa. Seminaari oli suunnattu Itä-Aasian arkistoille, mutta meidät kutsuttiin kertomaan Euroopan (ja Suomen) tämän hetkisestä tilanteesta nyt, kun Euroopan tietoarkistojen yhteinen EU-tutkimusinfrastruktuuri – CESSDA ERIC – on aloittamassa toimintaansa. Matkaan lähtivät arkiston johtaja Sami Borg ja minä.

Suomen tietoarkiston lisäksi seminaariin oli kutsuttu Korean tietoarkisto KOSSDA ja Taiwanin tietoarkisto SRDA. Lisäksi paikalla oli edustajia Soulin yliopistosta. Ohjelma oli tiivis. Ennen seminaarin alkua teimme tutustumiskäynnin SSJDA:n tiloihin. Varsinainen seminaari jakautui suljettuun, kutsutuille arkistoille tarkoitettuun osaan ja avoimeen osaan, johon kaikki kiinnostuneet Tokion yliopistolla olivat tervetulleita.

Oli mielenkiintoista havaita kuinka samanlaista arkistojen toiminta oli vaikka kaikkien organisaatiotausta oli erilainen. SSJDA on osa Tokion yliopiston yhteiskuntatieteellistä tutkimuskeskusta. Korean KOSSDAn taustalla on yksityinen säätiö. Taiwanin SRDA on osa Taiwanin kansallisen tutkimusakatemian Academia Sinican kulttuuri- ja yhteiskuntatieteiden alan tutkimuskeskusta. Suomen tietoarkisto puolestaan on opetus- ja kulttuuriministeriön Tampereen yliopistolle osoittama palvelutehtävä ja yliopiston erillisyksikkö.

Erilaisista taustoista huolimatta meitä kaikkia kuitenkin yhdistää se, että luovutamme aineistoja jatkokäyttöön oman kotiorganisaation ulkopuolelle. Aineistojen valmistelu arkistoitavaksi ja jatkokäyttöön tapahtui myös pääosin samojen periaatteiden mukaan, mutta aineistojen hankintatavat eroavat jonkin verran. Japanissa ja Taiwanissa osa aineistoista tulee suoraan isäntäorganisaation tutkijoilta ja osa hankitaan samaan tapaan kuin pääosa aineistoista meillä Suomessa: ottamalla yhteyttä suoraan tutkijoihin ja tutkimusorganisaatioihin. KOSSDAssa hankinta perustuu pitkälti eri organisaatioiden ja järjestöjen kanssa tehtyihin jäsenyyssopimuksiin. Lisäksi sen kumppanit toimittavat KOSSDAlle aineistoja selvästi enemmän kuin KOSSDA pystyy käsittelemään. Suomalaisen tietoarkistolaisen silmissä tämä vaikutti lähinnä positiiviselta ongelmalta.

Kaikki seminaariin osallistuneet arkistot toimittavat aineistoja oman kotimaansa ulkopuolelle. Myös suomalaiset tutkijat voivat saada esimerkiksi Japanin tietoarkiston aineistoja käyttöönsä. Kieli tosin saattaa muodostua ongelmaksi – kaikkea ei ole saatavilla englanniksi.

En itse ollut aiemmin käynyt Japanissa, joten seminaarin lisäksi kaikki muukin oli hyvin kiinnostavaa. Tokio on valtava kaupunki, ja on uskomatonta kuinka hyvin kaikki siellä toimii. Japanilaiset ovat kohteliaita ja avuliaita.

Tietoarkistojen kanssakäyminen on hyvin vilkasta. Eurooppalaisten arkistojen yhteistyön painopiste on kuitenkin Euroopassa ja eurooppalaisuus varmasti painottuu edelleen CESSDA ERICin myötä. Oli hyvin mielenkiintoista tavata myös aasialaisten tietoarkistojen edustajia ja kuulla näiden toiminnasta.

Matti Heinonen
ATK-erikoistutkija
etunimi.sukunimi [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

ATT käynnistyi

Opetus- ja kulttuuriministeriö on käynnistänyt tiedon saatavuuden ja avoimen tieteen edistämiseksi Avoimen tieteen ja tutkimuksen hankkeen vuosille 2014–2017. Virallisena tavoitteenaan ATT-hanke ”määrittää kansallisen tahtotilan vuodelle 2017 ja edistää avointa tiedettä kolmella rintamalla: tutkimusjulkaisut, tutkimusdata ja menetelmät”.

Avausseminaari järjestettiin Helsingissä 19.3.2014. Ohjelman pääosan muodostivat kolme paneelia, joissa aiheina olivat hankkeen tavoitteiden mukaan avoimet julkaisut, avoin data ja avoimet menetelmät. Toimin puheenjohtajana tutkimusdatapaneelissa, johon osallistuivat panelisteina Pirjo-Leena Forsström CSC:stä, Laura Höijer Ympäristöhallinnosta, Tuuli Toivonen Helsingin yliopistosta sekä Jussi Simpura THL:stä. Kokoan seuraavassa paneelin antia kahdesta keskusteluteemasta.

Miksi avata tutkimusdataa? Keskustelussa nousi esiin demokratianäkökulma: avaamalla tutkimusdataa kaikki pääsevät käyttämään sitä. Datan avoimen saatavuuden koheneminen voi myös edesauttaa innovaatioita ja luovuutta, mikä edistää tutkimuksen tuottavuutta.

Vaikka datan avaaminen maksaa, se voi tuottaa uutta liiketoimintaa ja tuoda myös säästöjä muun muassa uusien aineistojen pienempinä keruukustannuksina. Suomea koskevan tutkimusdatan avaaminen kansainväliseen käyttöön saattaa myös luoda uudentyyppistä, maatamme hyödyttävää tutkimustoimintaa ulkomaille.

Tutkijoiden näkökulmasta datan avaamista pidettiin erittäin keskeisenä tavoitteena. Useat panelistit mainitsivat tarpeen tieteellisen toimintakulttuurin muutokseen siten, että tutkimusdatan julkaiseminen ymmärrettäisiin tieteellisenä meriittinä. Oman tutkimuksen aineistojen avaaminen on tutkijalle myös uskottavuuskysymys, koska datansa julkaisseen tutkijan tulokset voi aina tarkistaa.

Paneeli käsitteli myös tutkimusdatan avaamisen haasteita Suomessa. Mainittujen asioiden lista muodostui pitkäksi: miten viitata tutkimusdataan ja antaa siitä meriittiä; tekijyys- ja omistajuuskysymykset; datan lisensointi; tietosuojakysymykset ja tutkimusetiikka; julkaisujen, datan ja menetelmien yhdistäminen; tutkimustiedon hyödyntäminen yhteiskunnallisessa päätöksenteossa jne.

Avaamista tukevan toimintakulttuurimuutoksen haasteena on edelleen tutkimusdatan ymmärtäminen tutkijan (omana) pääomana. Liian usein datan jakaminen mielletään siitä luopumisena ja ehkä kilpailuedunkin menettämisenä. Juuri siksi tutkimusrahoittajien ja -organisaatioiden tulisi edellyttää ja ohjeistaa tutkimusdatan hallintaa ja sen suunnittelua riittävästi. Aineistonhallinnan suunnittelu ja toteuttaminen pitäisi saada itsestään selväksi osaksi tutkijoiden perustyönkuvaa.

Lisäksi paneeli totesi, että tietovarantojen avaamisessa on otettava huomioon riittävä jatkokäytön tuki. Monien tutkimusaineistojen järkevä jatkokäyttö vaatii vierihoitoa aineiston keränneeltä taholta. Tutkimusdatan jatkokäyttäjän ei siis pidä lähteä soitellen sotaan. Ei pidä laulaa virttä, jos ei tiedä sen numeroa.

Datapaneeli on nähtävissä kokonaisuudessaan seminaaritallenteesta, joka sisältää kaikki muutkin seminaariesitykset ja paneelit. Seminaari oli hyvä avaus ATT:lle.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

ATT käynnistyi

Opetus- ja kulttuuriministeriö on käynnistänyt tiedon saatavuuden ja avoimen tieteen edistämiseksi Avoimen tieteen ja tutkimuksen hankkeen vuosille 2014–2017. Virallisena tavoitteenaan ATT-hanke ”määrittää kansallisen tahtotilan vuodelle 2017 ja edistää avointa tiedettä kolmella rintamalla: tutkimusjulkaisut, tutkimusdata ja menetelmät”.

Avausseminaari järjestettiin Helsingissä 19.3.2014. Ohjelman pääosan muodostivat kolme paneelia, joissa aiheina olivat hankkeen tavoitteiden mukaan avoimet julkaisut, avoin data ja avoimet menetelmät. Toimin puheenjohtajana tutkimusdatapaneelissa, johon osallistuivat panelisteina Pirjo-Leena Forsström CSC:stä, Laura Höijer Ympäristöhallinnosta, Tuuli Toivonen Helsingin yliopistosta sekä Jussi Simpura THL:stä. Kokoan seuraavassa paneelin antia kahdesta keskusteluteemasta.

Miksi avata tutkimusdataa? Keskustelussa nousi esiin demokratianäkökulma: avaamalla tutkimusdataa kaikki pääsevät käyttämään sitä. Datan avoimen saatavuuden koheneminen voi myös edesauttaa innovaatioita ja luovuutta, mikä edistää tutkimuksen tuottavuutta.

Vaikka datan avaaminen maksaa, se voi tuottaa uutta liiketoimintaa ja tuoda myös säästöjä muun muassa uusien aineistojen pienempinä keruukustannuksina. Suomea koskevan tutkimusdatan avaaminen kansainväliseen käyttöön saattaa myös luoda uudentyyppistä, maatamme hyödyttävää tutkimustoimintaa ulkomaille.

Tutkijoiden näkökulmasta datan avaamista pidettiin erittäin keskeisenä tavoitteena. Useat panelistit mainitsivat tarpeen tieteellisen toimintakulttuurin muutokseen siten, että tutkimusdatan julkaiseminen ymmärrettäisiin tieteellisenä meriittinä. Oman tutkimuksen aineistojen avaaminen on tutkijalle myös uskottavuuskysymys, koska datansa julkaisseen tutkijan tulokset voi aina tarkistaa.

Paneeli käsitteli myös tutkimusdatan avaamisen haasteita Suomessa. Mainittujen asioiden lista muodostui pitkäksi: miten viitata tutkimusdataan ja antaa siitä meriittiä; tekijyys- ja omistajuuskysymykset; datan lisensointi; tietosuojakysymykset ja tutkimusetiikka; julkaisujen, datan ja menetelmien yhdistäminen; tutkimustiedon hyödyntäminen yhteiskunnallisessa päätöksenteossa jne.

Avaamista tukevan toimintakulttuurimuutoksen haasteena on edelleen tutkimusdatan ymmärtäminen tutkijan (omana) pääomana. Liian usein datan jakaminen mielletään siitä luopumisena ja ehkä kilpailuedunkin menettämisenä. Juuri siksi tutkimusrahoittajien ja -organisaatioiden tulisi edellyttää ja ohjeistaa tutkimusdatan hallintaa ja sen suunnittelua riittävästi. Aineistonhallinnan suunnittelu ja toteuttaminen pitäisi saada itsestään selväksi osaksi tutkijoiden perustyönkuvaa.

Lisäksi paneeli totesi, että tietovarantojen avaamisessa on otettava huomioon riittävä jatkokäytön tuki. Monien tutkimusaineistojen järkevä jatkokäyttö vaatii vierihoitoa aineiston keränneeltä taholta. Tutkimusdatan jatkokäyttäjän ei siis pidä lähteä soitellen sotaan. Ei pidä laulaa virttä, jos ei tiedä sen numeroa.

Datapaneeli on nähtävissä kokonaisuudessaan seminaaritallenteesta, joka sisältää kaikki muutkin seminaariesitykset ja paneelit. Seminaari oli hyvä avaus ATT:lle.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

ICPSR:n kesäkurssit arkistoijan opinahjona

Michiganin yliopiston yhteydessä Ann Arborissa toimiva data-arkisto ICPSR (Inter-university Consortium for Political and Social Research) järjestää vuosittain lukuisia erilaisia kesäkursseja, joiden kohderyhmänä ovat tutkijat ja arkistoalan työntekijät ympäri maailmaa. Silloin tällöin myös Yhteiskuntatieteellinen tietoarkisto lähettää työntekijöitänsä Ann Arboriin hankkimaan koulutusta ja uusia ideoita tutkimusaineistojen arkistointiin. Samalla tarjoutuu hyvä mahdollisuus vaihtaa kokemuksia muualta maailmasta tulleiden arkistoalan työntekijöiden kanssa. Tänä vuonna matka-arpa osui omalle kohdalleni.

ICPSR:n kesäkurssien pääpaino on ollut perinteisesti vahvasti kvantitatiivisten tutkimusaineistojen puolella, mutta heinä-elokuun vaihteessa järjestetty viisipäiväinen Curating and Managing Research Data for Re-Use tarjosi kiinnostavia näkökulmia myös kvalitatiivisten aineistojen käsittelyyn ja arkistointiin.

Kurssille osallistui 26 eri tavoin tutkimusaineistojen arkistoinnin parissa työskentelevää henkilöä. Suurin osa osallistujista tuli Yhdysvalloista, mutta joukossa oli kauempaa tulleita arkistotyöntekijöitä myös Kanadasta, Etelä-Afrikasta ja Ruotsista. Kurssin opettajina toimivat Jared Lyle ja Mary Vardigan ICPSR:stä sekä Ron Nakao Stanford Universitystä ja Jake Carlson Purdue Universitystä.

Kunkin päivän ohjelma oli rakennettu oman teeman ympärille. Päivittäisiä teemoja olivat tutkimusaineistojen elinkaari, arkistointipolitiikat, aineiston käsittely, aineistojen tietoturvallinen säilytys sekä jatkokäyttö. Kunkin päivän pääpuhuja oli kyseiseen teemaan erikoistunut asiantuntija. Luentojen lisäksi kurssi sisälsi paljon ryhmätöinä tehtyjä harjoituksia. Virallisen ohjelman ulkopuolella kurssin sisältöön kuului vierailu läheisessä Clarkin kirjastossa, jossa meille esiteltiin esimerkiksi kartta-aineistojen digitointia.

Kurssilla tutustuimme muun muassa erilaisiin teknisiin työkaluihin, jotka auttavat tutkimusaineistojen kuvailujen laatimisessa ja metadatan tallentamisessa. Opimme myös kuinka toimii pitkälle automatisoitu aineistojen talletusjärjestelmä, jossa tutkija voi luovuttaa tutkimusaineistonsa arkistoon suoraan verkossa. Tulevaisuudessa, kun rahoittajat uudistavat data-politiikkaansa ja arkistointivelvoitteet lisääntyvät myös Suomessa, vastaavaan järjestelmään siirtyminen on mitä todennäköisimmin edessä myös Yhteiskuntatieteellisessä tietoarkistossa.

Kokonaisuudessaan osallistuminen ICPSR:n kesäkurssille oli kaikin puolin hieno ja opettavainen kokemus. Opimme paljon ICPSR:n omista arkistointikäytännöistä ja aineistonkäsittelyntavoista. Lisäksi tutustuimme laajalti muihin mahdollisuuksiin käsitellä arkistoitavia tutkimusaineistoja ja saattaa niitä jatkokäyttäjien ulottuville. Uskallankin suositella nyt toista kertaa järjestettyä kurssia kaikille, jotka työskentelevät tutkimusaineistojen arkistoinnin parissa.

Lisätietoja: ICPSR:n kesäkurssien verkkosivusto.

Jarkko Päivärinta
tutkimusamanuenssi
etunimi.sukunimi [at] uta.fi

ICPSR:n kesäkurssit arkistoijan opinahjona

Michiganin yliopiston yhteydessä Ann Arborissa toimiva data-arkisto ICPSR (Inter-university Consortium for Political and Social Research) järjestää vuosittain lukuisia erilaisia kesäkursseja, joiden kohderyhmänä ovat tutkijat ja arkistoalan työntekijät ympäri maailmaa. Silloin tällöin myös Yhteiskuntatieteellinen tietoarkisto lähettää työntekijöitänsä Ann Arboriin hankkimaan koulutusta ja uusia ideoita tutkimusaineistojen arkistointiin. Samalla tarjoutuu hyvä mahdollisuus vaihtaa kokemuksia muualta maailmasta tulleiden arkistoalan työntekijöiden kanssa. Tänä vuonna matka-arpa osui omalle kohdalleni.

ICPSR:n kesäkurssien pääpaino on ollut perinteisesti vahvasti kvantitatiivisten tutkimusaineistojen puolella, mutta heinä-elokuun vaihteessa järjestetty viisipäiväinen Curating and Managing Research Data for Re-Use tarjosi kiinnostavia näkökulmia myös kvalitatiivisten aineistojen käsittelyyn ja arkistointiin.

Kurssille osallistui 26 eri tavoin tutkimusaineistojen arkistoinnin parissa työskentelevää henkilöä. Suurin osa osallistujista tuli Yhdysvalloista, mutta joukossa oli kauempaa tulleita arkistotyöntekijöitä myös Kanadasta, Etelä-Afrikasta ja Ruotsista. Kurssin opettajina toimivat Jared Lyle ja Mary Vardigan ICPSR:stä sekä Ron Nakao Stanford Universitystä ja Jake Carlson Purdue Universitystä.

Kunkin päivän ohjelma oli rakennettu oman teeman ympärille. Päivittäisiä teemoja olivat tutkimusaineistojen elinkaari, arkistointipolitiikat, aineiston käsittely, aineistojen tietoturvallinen säilytys sekä jatkokäyttö. Kunkin päivän pääpuhuja oli kyseiseen teemaan erikoistunut asiantuntija. Luentojen lisäksi kurssi sisälsi paljon ryhmätöinä tehtyjä harjoituksia. Virallisen ohjelman ulkopuolella kurssin sisältöön kuului vierailu läheisessä Clarkin kirjastossa, jossa meille esiteltiin esimerkiksi kartta-aineistojen digitointia.

Kurssilla tutustuimme muun muassa erilaisiin teknisiin työkaluihin, jotka auttavat tutkimusaineistojen kuvailujen laatimisessa ja metadatan tallentamisessa. Opimme myös kuinka toimii pitkälle automatisoitu aineistojen talletusjärjestelmä, jossa tutkija voi luovuttaa tutkimusaineistonsa arkistoon suoraan verkossa. Tulevaisuudessa, kun rahoittajat uudistavat data-politiikkaansa ja arkistointivelvoitteet lisääntyvät myös Suomessa, vastaavaan järjestelmään siirtyminen on mitä todennäköisimmin edessä myös Yhteiskuntatieteellisessä tietoarkistossa.

Kokonaisuudessaan osallistuminen ICPSR:n kesäkurssille oli kaikin puolin hieno ja opettavainen kokemus. Opimme paljon ICPSR:n omista arkistointikäytännöistä ja aineistonkäsittelyntavoista. Lisäksi tutustuimme laajalti muihin mahdollisuuksiin käsitellä arkistoitavia tutkimusaineistoja ja saattaa niitä jatkokäyttäjien ulottuville. Uskallankin suositella nyt toista kertaa järjestettyä kurssia kaikille, jotka työskentelevät tutkimusaineistojen arkistoinnin parissa.

Lisätietoja: ICPSR:n kesäkurssien verkkosivusto.

Jarkko Päivärinta
tutkimusamanuenssi
etunimi.sukunimi [at] uta.fi