Tag Archives: yhteiskatalogit

FSD’s multilingual and qualitative data expertise brings in international visitors

During its 20 years of operation, FSD has established its status as a trusted partner in collaboration of data archives. On the initiative of our Japanese colleagues, we organised a seminar entitled Metadata, Data Catalogues and Tools for Findability in March.

The motivation for the seminar was a Japanese national project developing a joint data catalogue of several service providers. Our Japanese visitors chose to visit Finland and FSD because we have a long experience in successfully providing services in two languages, Finnish and English, as well as delivering metadata for harvesting by national and international joint catalogues.

We designed our presentations to answer the needs of our guests. FSD’s experts shared experiences of using the DDI-C metadata format, the process of joining national and international multidisciplinary catalogues, the significance and utilisation of controlled vocabularies, and the CoreTrustSeal certification, among others.

Professor Yukio Maeda presents JSPS’s plan for a federated data catalogue. Photo: Tuomas J. Alaterä

In addition to talks by FSD experts and our guests from Japan, the seminar featured presentations by the Director of CESSDA Ron Dekker and the Swedish National Data Service’s IT Systems Architect Olof Olsson. It is important for CESSDA to collaborate with organisations outside of Europe. The seminar in Tampere provided a good opportunity to share information about CESSDA strategy and objectives in responsible data sharing as well as the CESSDA Data Catalogue, which contains both FSD’s and SND’s metadata. SND makes use of the DDI-L format, and Olsson’s presentation on the topic offered a good comparison of two distinct metadata solutions. The presentation was also interesting from FSD’s systems development point of view.

Similar challenges

The seminar showed that the challenges of research data management and sharing are very similar everywhere. Similarly to Finland and Europe, researchers in Japan have a positive attitude towards data sharing in principle. However, when it comes to sharing their own data with others, they do not feel comfortable doing so or they prefer to share the data themselves rather than letting professionals do it for them. Our data acquisition team regularly encounters similar attitudes.

Seminar attendees. Photo: Misa Senbonmatsu

What also sounded familiar was the fact that the development of the data infrastructure is not actually nationally coordinated in Japan. Instead, the funder has opened a competition where different service providers are able to apply for funding for projects with certain pre-defined conditions. The big picture is then made up of what various organisations think is necessary and which project proposals the funder approves. Another thing to consider is how established the infrastructure operations will be after the funding period.

More information:

» DDI-C ja L documentation
» CESSDA ERIC
» Swedish National Data Service SND
» Japan Society for the Promotion of Science JSPS
» FSD metadata records in machine readable formats
» Data are described in the DDI format
» Vocabularies used in FSD’s data descriptions

Helena Laaksonen
director
firstname.surname [at] tuni.fi

This blog entry is also available in Finnish:
Monikielinen aineisto-osaaminen ja laadullisten aineistojen asiantuntemus tuovat kansainvälisiä vieraita Tietoarkistoon.

Monikielinen aineisto-osaaminen ja laadullisten aineistojen asiantuntemus tuovat kansainvälisiä vieraita Tietoarkistoon

Tietoarkisto on 20 toimintavuotensa aikana vakiinnuttanut asemansa luotettuna kumppanina data-arkistojen yhteistyössä. Maaliskuussa järjestimme japanilaisten kollegojen kanssa, heidän aloitteestaan, seminaarin Metadata, Data Catalogues and Tools for Findability.

Kansainvälisen seminaarin taustalla on Japanin kansallinen hanke, jossa he rakentavat usean palveluntarjoajan yhteistä aineistoluetteloa. Japanilaiset vieraat valitsivat Suomen ja Tietoarkiston vierailukohteekseen, koska Tietoarkistolla on pitkä kokemus onnistuneesta kaksikielisten palvelujen tuottamisesta suomeksi ja englanniksi sekä tutkimusaineistojen kuvailutietojen saattamisesta haravoitaviksi kansallisiin ja kansainvälisiin yhteisluetteloihin.

Tietoarkistossa koostimme oman osuutemme ohjelmaan vieraiden tiedontarpeesta lähtien. Tietoarkiston asiantuntijat kertoivat muun muassa DDI-C-kuvailuformaatin hyödyntämisestä Tietoarkistossa, liittymisestä kansallisiin ja kansainvälisiin monitieteisiin luetteloihin, monikielisten asiasanastojen merkityksestä ja hyödyntämisestä sekä CTS-sertifioinnista.

Professori Yukio Maeda esittelee JSPS:n suunnitelmaa yhteiskatalogiksi.
Kuva: Tuomas J. Alaterä

Seminaarissa esiintyivät Tietoarkiston asiantuntijoiden ja japanilaisten vieraiden lisäksi CESSDA ERICin johtaja Ron Dekker ja Ruotsin datapalvelun SND:n järjestelmäarkkitehti Olof Olsson. CESSDAlle on tärkeää luoda yhteistyösuhteita myös Euroopan ulkopuolelle. Tampereen seminaari antoi hyvän mahdollisuuden kertoa CESSDAn strategiasta ja tavoitteista tutkimusdatan vastuullisen avaamisen alalla, unohtamatta CESSDAn aineistoluetteloa, johon myös Tietoarkiston ja SND:n metadata haravoidaan. Ruotsin SND hyödyntää DDI-L-kuvailuformaattia. Olssonin esitys aiheesta tarjosi hyvän vertailukohdan kahden erilaisen metadataratkaisun välillä ja oli kiinnostava myös Tietoarkiston järjestelmäkehityksen näkökulmasta.

Samankaltaiset haasteet

Varsinaisen asiasisällön lisäksi seminaari osoitti kaikille osallistujille, että tutkimusaineistojen hallinnan ja avaamisen ongelmat ovat kaikkialla hyvin samanlaisia. Japanissakin tutkijat suhtautuvat periaatteessa myönteisesti, mutta eivät usein halua jakaa omaa dataansa muiden kanssa. Ja jos he haluavat, he usein tekevät sen mieluummin itse kuin antavat asiaan perehtyneiden ammattilaisten hoitaa tehtävän puolestaan. Tämä on Tietoarkiston aineistonhankinnassa tuttua.

Seminaariosallistujat. Kuva: Misa Senbonmatsu

Kovin tutulta vaikutti myös se, että datainfrastruktuurin rakentamista ei varsinaisesti koordinoida Japanissa kansallisesti. Rahoittaja on avannut kilpailun, josta eri palveluntarjoajat ovat voineet hakea rahoitusta tietyin ehdoin määritellyille hankkeille. Kansallinen kokonaiskuva rakentuu siitä, mitä erilliset organisaatiot pitävät tarpeellisena – ja mitä rahoittaja näistä esityksistä jatkoon valitsee. Perustamisvaiheen ohella pohdittavaa aiheuttaa infrastruktuurin toiminnan vakiinnuttaminen rahoituskauden päättyessä.

Lisätietoa:

» DDI-C ja L -dokumentaatio
» CESSDA ERIC
» Svensk nationell datatjänst SND
» Japan Society for the Promotion of Science JSPS
» Aineistokuvailut koneluettavissa formaateissa
» Aineistokuvailun DDI-formaatti
» Aineistonkuvailussa käytetyt sanastot

Helena Laaksonen
johtaja
etunimi.sukunimi [at] tuni.fi

Tämä blogikirjoitus on luettavissa myös englanniksi:
FSD’s multilingual and qualitative data expertise brings in international visitors.

Tietoarkisto on aktiivinen eurooppalainen osaaja

Tietoarkisto on CESSDAn Suomen kansallinen palveluntuottaja. Tämä lyhyt toteamus pitää sisällään paljon hankkeita ja paljon työtä – sekä runsaasti puhelin- ja videokokouksia, onhan kysymys yhteiseurooppalaisesta toiminnasta. Kaiken tavoitteena on parempia ja helpommin saavutettavia eurooppalaisia data-, aineistonhallinta- ja koulutuspalveluja tutkijoille.

CESSDA on lyhenne sanoista Consortium of European Social Science Data Archives. Lyhyesti sanottuna CESSDA on eurooppalainen tutkimusinfrastruktuuri, joka tarjoaa tutkijoille kansainvälistä aineistopalvelua ja koulutusta. CESSDAn jäseniä ovat valtiot, ja sen keskustoimisto sijaitsee Bergenissä. Varsinaisten tutkijapalveluiden tuottamisen hoitavat jäsenmaiden data-arkistot, Suomessa siis Tietoarkisto.

Nykyisessä konsortiomuodossaan CESSDA on toiminut kesäkuusta 2013, mutta sen historia Euroopan kansallisten tietoarkistojen epävirallisena kattojärjestönä alkaa jo vuodesta 1976. Tällä hetkellä CESSDAssa tapahtuu enemmän kuin koskaan. Viime vuonna alkoi useita hankkeita, jotka tähtäävät keskitettyjen palveluiden rakentamiseen ja CESSDAn laajentumiseen.


Kuvassa CESSDA House Bergenissä.

Suomen Akatemian FIRI-rahoituksen myötä Tietoarkiston palvelut ja osaaminen ovat viimeisten viiden vuoden aikana nousseet kansainväliselle huipputasolle. Haluammekin viedä meillä käytössä olevat hyvät toimintatavat osaksi eurooppalaisia tutkijapalveluita. Tietenkin haluamme vastaavasti myös tuoda parhaat eurooppalaiset data- ja koulutuspalvelut suomalaisen tutkimusyhteisön ulottuville. Tämä onnistuu parhaiten olemalla CESSDAssa proaktiivinen toimija ja vaikuttaja. Ja sellainen Tietoarkisto on.

Esimerkiksi oma työni koostuu seuraavat kaksi vuotta lähes kokonaan CESSDAan liittyvistä tehtävistä. Myös monet muut tietoarkistolaiset osallistuvat aktiivisesti CESSDAn toimintoihin.

CESSDA etenee palvelujen rakentamisessa työsuunnitelmansa mukaan. Työsuunnitelma koostuu tehtävistä, joita kansalliset palveluntuottajat toteuttavat joko yksin tai yhdessä. Toteuttajat valitaan kilpailumenettelyllä: palveluntuottajat lähettävät CESSDAlle hankehakemuksen, joka sisältää sekä suunnitelman että kustannusarvion, ja ulkoisen arvioinnin jälkeen CESSDA valitsee parhaan hanke-esityksen toteutettavaksi.

Tietoarkisto on mukana kolmessa työsuunnitelman mukaisessa hankkeessa, mitä voidaan pitää erinomaisena saavutuksena. Nämä kolme hanketta ovat:

  • CESSDA Metadata Management -hanke, jota Tietoarkisto johtaa. Hankkeessa luodaan yhteinen metatietomalli ja yhteiset metatietokäytännöt CESSDAn palveluntuottajille. Yhteinen metatietoprofiili ja monikieliset kontrolloidut sanastot tukevat yhteisten eurooppalaisten palvelujen, kuten aineistoluettelon ja kysymyspankin rakentamista. Tietoarkiston lisäksi hankkeessa on mukana seitsemän palveluntuottajaa. Hanke päättyy keväällä 2017.
  • CESSDA Metadata Harvesting Tool -hanke, joka kehittää metadatan haravointiratkaisun muun muassa CESSDAn yhteisen aineistoluettelon rakentamista varten. Hanketta vetää Norjan tietoarkisto NSD ja siinä on mukana neljä palveluntuottajaa. Haravointityökalu valmistuu vuoden 2016 aikana.
  • CESSDA Expert Seminar 2015 on Trust -hanke, joka järjesti joulukuussa 2015 CESSDAn asiantuntijaseminaarin Haagissa. Päävastuun seminaarista kantoi hollantilainen DANS, ja Tietoarkisto oli yksi kolmesta muusta järjestäjästä. Seminaarin aiheina olivat luotettava sähköinen pitkäaikaissäilytys ja CESSDAn palveluntuottajille asettamat vaatimukset.

CESSDA on perustanut myös neljä pysyvää työryhmää ohjaamaan toimintaa. Työryhmät koostuvat palveluntuottajien asiantuntijoista. Tietoarkisto on mukana kolmessa työryhmässä: CESSDA Trust Support Group, CESSDA Training Group ja CESSDA Communications Group. Lisäksi Tietoarkisto on aktiivisesti mukana kehittämässä yhteiskuntatieteiden monikielistä tesaurusta ELSSTiä.

Keskitettyjen palveluiden rakentamisen ohella CESSDA laajentaa verkostoaan seuraavien kahden vuoden aikana. Nykyisten 15 jäsenmaan lisäksi konsortioon halutaan mukaan loputkin Euroopan maat. Tätä varten CESSDA haki ja sai rahoitusta Euroopan unionin tutkimuksen ja innovoinnin Horizon 2020 -puiteohjelmasta. CESSDA SaW: Strengthening and widening the European infrastructure for social science data archives -hanke jatkuu elokuuhun 2017 asti. Tietoarkisto on mukana työpaketissa, jonka teemana on tietämyksen jakaminen eri arkistojen välillä, ja jossa keskitytään muun muassa digitaalisen pitkäaikaissäilyttämisen haasteisiin ja malleihin, sertifiointiin ja kustannuksiin. SaW-projektin myötä CESSDA luo Euroopan tutkimusalueen data-arkistoille entistä tiiviimmän ja vuorovaikutteisemman yhteistyöverkon.

Tässä esitellyt tehtävät ja hankkeet ovat vain alkua CESSDA-palvelujen rakentamiselle. Työsuunnitelmassa riittää tehtävää useammalle vuodelle, ja uusia avauksia otetaan mukaan maailman muuttuessa. Toivon ja uskon, että Tietoarkisto osallistuu aktiivisesti CESSDAn kehittämiseen tässä mainittujen hankkeiden päätyttyäkin. On tehokkaampaa olla luomassa yhteisiä käytäntöjä kuin rakentaa omia erillisiä ratkaisuja tai sopeuttaa omia olemassa olevia ja toimivia ratkaisuja toisten vaatimuksiin.

Lisätietoja:
» CESSDAn palvelut Tietoarkiston sivuilla
» CESSDA SaW
» CESSDAn verkkosivut
» Tietoarkiston hankkeet

Mari Kleemola
kehittämispäällikkö, projektit ja kehittäminen -moduulin johtaja
etunimi.sukunimi [at] uta.fi

Tietoarkisto on aktiivinen eurooppalainen osaaja

Tietoarkisto on CESSDAn Suomen kansallinen palveluntuottaja. Tämä lyhyt toteamus pitää sisällään paljon hankkeita ja paljon työtä – sekä runsaasti puhelin- ja videokokouksia, onhan kysymys yhteiseurooppalaisesta toiminnasta. Kaiken tavoitteena on parempia ja helpommin saavutettavia eurooppalaisia data-, aineistonhallinta- ja koulutuspalveluja tutkijoille.

CESSDA on lyhenne sanoista Consortium of European Social Science Data Archives. Lyhyesti sanottuna CESSDA on eurooppalainen tutkimusinfrastruktuuri, joka tarjoaa tutkijoille kansainvälistä aineistopalvelua ja koulutusta. CESSDAn jäseniä ovat valtiot, ja sen keskustoimisto sijaitsee Bergenissä. Varsinaisten tutkijapalveluiden tuottamisen hoitavat jäsenmaiden data-arkistot, Suomessa siis Tietoarkisto.

Nykyisessä konsortiomuodossaan CESSDA on toiminut kesäkuusta 2013, mutta sen historia Euroopan kansallisten tietoarkistojen epävirallisena kattojärjestönä alkaa jo vuodesta 1976. Tällä hetkellä CESSDAssa tapahtuu enemmän kuin koskaan. Viime vuonna alkoi useita hankkeita, jotka tähtäävät keskitettyjen palveluiden rakentamiseen ja CESSDAn laajentumiseen.


Kuvassa CESSDA House Bergenissä.

Suomen Akatemian FIRI-rahoituksen myötä Tietoarkiston palvelut ja osaaminen ovat viimeisten viiden vuoden aikana nousseet kansainväliselle huipputasolle. Haluammekin viedä meillä käytössä olevat hyvät toimintatavat osaksi eurooppalaisia tutkijapalveluita. Tietenkin haluamme vastaavasti myös tuoda parhaat eurooppalaiset data- ja koulutuspalvelut suomalaisen tutkimusyhteisön ulottuville. Tämä onnistuu parhaiten olemalla CESSDAssa proaktiivinen toimija ja vaikuttaja. Ja sellainen Tietoarkisto on.

Esimerkiksi oma työni koostuu seuraavat kaksi vuotta lähes kokonaan CESSDAan liittyvistä tehtävistä. Myös monet muut tietoarkistolaiset osallistuvat aktiivisesti CESSDAn toimintoihin.

CESSDA etenee palvelujen rakentamisessa työsuunnitelmansa mukaan. Työsuunnitelma koostuu tehtävistä, joita kansalliset palveluntuottajat toteuttavat joko yksin tai yhdessä. Toteuttajat valitaan kilpailumenettelyllä: palveluntuottajat lähettävät CESSDAlle hankehakemuksen, joka sisältää sekä suunnitelman että kustannusarvion, ja ulkoisen arvioinnin jälkeen CESSDA valitsee parhaan hanke-esityksen toteutettavaksi.

Tietoarkisto on mukana kolmessa työsuunnitelman mukaisessa hankkeessa, mitä voidaan pitää erinomaisena saavutuksena. Nämä kolme hanketta ovat:

  • CESSDA Metadata Management -hanke, jota Tietoarkisto johtaa. Hankkeessa luodaan yhteinen metatietomalli ja yhteiset metatietokäytännöt CESSDAn palveluntuottajille. Yhteinen metatietoprofiili ja monikieliset kontrolloidut sanastot tukevat yhteisten eurooppalaisten palvelujen, kuten aineistoluettelon ja kysymyspankin rakentamista. Tietoarkiston lisäksi hankkeessa on mukana seitsemän palveluntuottajaa. Hanke päättyy keväällä 2017.
  • CESSDA Metadata Harvesting Tool -hanke, joka kehittää metadatan haravointiratkaisun muun muassa CESSDAn yhteisen aineistoluettelon rakentamista varten. Hanketta vetää Norjan tietoarkisto NSD ja siinä on mukana neljä palveluntuottajaa. Haravointityökalu valmistuu vuoden 2016 aikana.
  • CESSDA Expert Seminar 2015 on Trust -hanke, joka järjesti joulukuussa 2015 CESSDAn asiantuntijaseminaarin Haagissa. Päävastuun seminaarista kantoi hollantilainen DANS, ja Tietoarkisto oli yksi kolmesta muusta järjestäjästä. Seminaarin aiheina olivat luotettava sähköinen pitkäaikaissäilytys ja CESSDAn palveluntuottajille asettamat vaatimukset.

CESSDA on perustanut myös neljä pysyvää työryhmää ohjaamaan toimintaa. Työryhmät koostuvat palveluntuottajien asiantuntijoista. Tietoarkisto on mukana kolmessa työryhmässä: CESSDA Trust Support Group, CESSDA Training Group ja CESSDA Communications Group. Lisäksi Tietoarkisto on aktiivisesti mukana kehittämässä yhteiskuntatieteiden monikielistä tesaurusta ELSSTiä.

Keskitettyjen palveluiden rakentamisen ohella CESSDA laajentaa verkostoaan seuraavien kahden vuoden aikana. Nykyisten 15 jäsenmaan lisäksi konsortioon halutaan mukaan loputkin Euroopan maat. Tätä varten CESSDA haki ja sai rahoitusta Euroopan unionin tutkimuksen ja innovoinnin Horizon 2020 -puiteohjelmasta. CESSDA SaW: Strengthening and widening the European infrastructure for social science data archives -hanke jatkuu elokuuhun 2017 asti. Tietoarkisto on mukana työpaketissa, jonka teemana on tietämyksen jakaminen eri arkistojen välillä, ja jossa keskitytään muun muassa digitaalisen pitkäaikaissäilyttämisen haasteisiin ja malleihin, sertifiointiin ja kustannuksiin. SaW-projektin myötä CESSDA luo Euroopan tutkimusalueen data-arkistoille entistä tiiviimmän ja vuorovaikutteisemman yhteistyöverkon.

Tässä esitellyt tehtävät ja hankkeet ovat vain alkua CESSDA-palvelujen rakentamiselle. Työsuunnitelmassa riittää tehtävää useammalle vuodelle, ja uusia avauksia otetaan mukaan maailman muuttuessa. Toivon ja uskon, että Tietoarkisto osallistuu aktiivisesti CESSDAn kehittämiseen tässä mainittujen hankkeiden päätyttyäkin. On tehokkaampaa olla luomassa yhteisiä käytäntöjä kuin rakentaa omia erillisiä ratkaisuja tai sopeuttaa omia olemassa olevia ja toimivia ratkaisuja toisten vaatimuksiin.

Lisätietoja:
» CESSDAn palvelut Tietoarkiston sivuilla
» CESSDA SaW
» CESSDAn verkkosivut
» Tietoarkiston hankkeet

Mari Kleemola
kehittämispäällikkö, projektit ja kehittäminen -moduulin johtaja
etunimi.sukunimi [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi