Tag Archives: löydettävyys

Being trustworthy and FAIR requires people, processes, technologies and collaboration

The Implementation Roadmap for the European Science Cloud (EOSC) puts focus on research data adhering to the FAIR principles of being findable, accessible, interoperable, and reusable. These are all excellent goals and the social science data archive community has been promoting similar ideas since at least the 1970’s. We know that managing, disseminating and preserving digital data for the long term is neither simple nor straightforward. Research data will not become nor stay FAIR by magic. We need skilled people, transparent processes, interoperable technologies and collaboration to build, operate and maintain research data infrastructures.

A key theme in digital preservation and thus in all FSD’s functions is trust. Data subjects need to be able to trust that data about them are handled in an appropriate way. Researchers need to have trust that FSD manages their data according to the agreements. FSD’s users need to be able to trust that they get access to reliable versions of data from FSD and that, for example, all changes made to the deposited datasets are documented. In short, FSD needs to be a trusted digital repository.

Shaping the trust landscape

Luckily, FSD is not alone. In addition to collaborating in national networks, FSD is the Finnish Service Provider for CESSDA ERIC (Consortium of European Social Science Data Archives). CESSDA requires that all its Service Providers adhere to the trustworthy digital repository requirements set by the CoreTrustSeal. In August 2017, FSD acquired the new CTS certification among the first CESSDA Service Providers.

FSD has been active in CESSDA’s trust work for several years and currently I am a member of the CESSDA Trust Working Group. The Group offers guidance and support to CESSDA members in understanding and acquiring the CoreTrustSeal and maintains an overview of the trust landscape including certification standards and the emergence of the FAIR data principles and the requirements of the EOSC. I am also a member of the CoreTrustSeal Board 2018–2021. These collaborations are essential for strengthening FSD’s expertise. They also provide unique insights to, and possibilities to be involved in, shaping the trust landscape.

Today is the World Digital Preservation Day. It brings together the digital preservation community to celebrate the collections preserved, the access maintained and the understanding fostered by preserving digital materials. I want to take this opportunity to celebrate FSD’s current and forthcoming collaborations and especially our staff’s great expertise and dedication. As the Chair of the CESSDA Trust Group Herve L’Hours has written: Technologies can be consolidated, and processes automated, but collection, creation, curation and research use/reuse of data is ultimately dependent on the domain and disciplinary expertise of the humans who know them best. (L’Hours 2018)

Happy Digital Preservation!

FSD’s work in CESSDA Trust Group and CoreTrustSeal are supported by CESSDA Trust Work Plan project and the Active FSD for CESSDA project funded by the Academy of Finland.

More information:

» Follow #WDPD2018 on Twitter
» CESSDA Trust Working Group
» CoreTrustSeal Board 2018-2021

Mari Kleemola
Development Manager
firstname.surname [at] uta.fi

New user-friendly website for FSD

Dear reader, it is very much possible that you’re reading this after noticing that our website has been given a facelift or after reading an announcement about it.

The previous FSD website was launched over six years ago, and a lot has changed in the way people browse the web since. The former site was not very suitable for use on mobile, or even tablet, screens. Even though nothing was broken per se, the site wasn’t exactly optimised for the mobile visitor. Unlike now. We have designed our new site with accessibility in mind, and it scales responsively to different types of screens.

Of course, the website overhaul had other objectives as well. Not getting caught up in the old ways was one of them. In six years, our services have also changed a lot, and we want to bring them forward in a new way. The starting point of the redesign was that all our user groups should find the services or information they need quickly and effortlessly.

The appearance has also changed. Now everything is a bit bigger and more colourful. Our website is our most important customer service channel and our business card as well as a meeting point for data depositors and users.

Content grouping has changed

Navigating the site is now done mainly via a “mega menu” that replaces the traditional sitemap and is always accessible, regardless of which page the user is currently viewing. We hope that this will facilitate finding the relevant contents if the URLs of pages have changed. However, we primarily aim to redirect the user to the right address automatically.

Most of the content regarding datasets directly has been moved to the Aila Data Service. The new site will include instructions on searching and using research data, introductions of featured datasets and theme pages as well as links to the most recent datasets on Aila.

Everything is new under the hood

Improvements on the site are not only cosmetic. With our partner Redflow Inc., we have developed a modern content management system, based on Hugo, for generating static pages. The CMS will be used for maintaining the FSD website and publishing new content. We wanted a secure solution that we could fine-tune to meet our needs and to fit seamlessly in with our development environment.

In the future, our other services will also receive the new look. For now, many of the services offered by FSD, such as Aila, Data Management Guidelines and Research Methods Web Resource MOTV, will have the old interface. The Swedish version of the website will receive more content in the coming weeks.

A lot of work has been done for the new website, but we have surely missed something. Maybe we have forgotten to move some content to the new page. Perhaps the interface works illogically on some browsers. It might be that a link takes you to the wrong place or nowhere at all. We will be glad to receive any feedback regarding the new site (tuki.fsd at uta.fi)!

Tuomas J. Alaterä
IT Services Specialist
firstname.surname [at] uta.fi

This blog post is available also in Finnish:
Tietoarkistolle käyttäjä- ja mobiiliystävälliset uudet verkkosivut.

Tietoarkistolle käyttäjä- ja mobiiliystävälliset uudet verkkosivut

Hyvä lukija, on hyvin mahdollista, että luet tätä huomattuasi tiedotteestamme tai saapumalla sivuillemme, että Tietoarkiston verkkosivut ovat uudistuneet.

Edellisestä sivustouudistuksesta on kulunut reilut kuusi vuotta. Tänä aikana tavoissa, joilla verkkoa selataan, on tapahtunut suuria muutoksia. Aiemmat sivumme eivät soveltuneet kovin hyvin kännykän tai edes tabletin näytöllä luettavaksi. Vaikka mikään ei sinänsä ollut rikki, niitä ei oltu optimoitu mobiilikäyttäjää varten. Toisin on nyt. Uudet sivumme on suunniteltu saavutettaviksi sekä responsiivisiksi ja ne skaalautuvat erilaisille näytöille.

Uudistuksella on toki ollut muitakin tavoitteita. Yksi niistä on uudistuminen itsessään. Kuudessa vuodessa myös Tietoarkiston palveluissa on tapahtunut muutoksia, ja haluamme tuoda palveluitamme näkyviin uudella tavalla. Suunnittelussa on lähdetty siitä, että kaikki asiakasryhmät löytäisivät mahdollisimman helposti heitä koskevat palvelumme tai kiinnostavan informaation.

Myös visuaalinen tyyli on erilainen. Nyt kaikki tehdään hieman isommin ja hieman värikkäämmin. Verkkosivumme ovat keskeisin asiakaspalvelun kanavamme, datan arkistoijan ja jatkokäyttäjän kohtaamispaikka ja käyntikorttimme.

Sisältöjä ryhmitelty uusiksi

Navigointi tapahtuu pääasiassa ”megamenun” kautta. Se korvaa perinteisen sivukartan ja on saatavilla aina, riippumatta siitä, missä kohtaa sivustoa tai yksittäistä sivua käyttäjä kulloinkin on. Tämän toivomme helpottavan sisällön löytämistä myös silloin kun sivujen osoitteet ovat muuttuneet. Ensi sijassa pyrimme ohjaamaan käyttäjän automaattisesti oikeaan osoitteeseen.

Uudistuksen myötä tutkimusaineistoja suoraan käsittelevä sisältö, kuten aineistoluettelo, on siirretty palveluportaali Ailan puolelle. Verkkosivuillamme sen sijaan julkaisemme aineistoesittelyjä, taustoitamme teemakokonaisuuksia ja linkitämme aineistoihin, joka ovat saatavilla Ailassa.

Konepellin alla kaikki on uutta

Muutos ei ole ainoastaan ulkoinen. Olemme kehittäneet yhteistyökumppanimme Redflow Inc:n kanssa modernin Hugo-pohjaisen staattisten sivujen generoimiseen soveltuvan sisällönhallintakokonaisuuden, jolla Tietoarkiston sivuja ylläpidetään ja julkaistaan. Halusimme tietoturvallisen ratkaisun, jota voimme säätää tarkasti omiin tarpeisiimme soveltuvaksi ja joka sopii saumattomasti tietotekniseen kehitysympäristöömme.

Jatkossa tulemme tuomaan uuden ulkoasun myös useisiin muihin palveluihimme. Toistaiseksi mm. palveluportaali Aila, Aineistonhallinnan käsikirja ja MOTV jatkavat vanhassa kuosissaan. Ruotsinkielisille sivuille sisältöjä tulee lisää lähiviikkoina.

Uudistusta varten on tehty paljon töitä, mutta varmasti jotain on jäänyt huomaamatta. Ehkä olemme unohtaneet siirtää joitain sisältöjä uusille sivuille. Kenties käyttöliittymässä on joillain selaimilla epäloogisuuksia. Mahdollisesti jokin linkki vie väärään sisältöön tai ei minnekään? Vastaanotamme mielellämme palautetta (tuki.fsd at uta.fi)!

Tuomas J. Alaterä
IT-palveluasiantuntija
etunimi.sukunimi [at] uta.fi

Tämä blogikirjoitus on luettavissa myös englanniksi:
New user-friendly website for FSD.

Tietoarkisto on FAIR

Avoimen tieteen piirissä on viimeisen vuoden aikana alettu puhua FAIR-periaatteista. Kiinnostuksen selittänee pitkälti EU:n Horisontti 2020 -ohjelma, joka painottaa tutkimusaineistojen hyvää hallintaa ja FAIR-periaatteita.

FAIR on lyhenne sanoista Findable, Accessible, Interoperable ja Re-usable. Suomeksi voitaisiin puhua tutkimusaineistojen löydettävyydestä, saavutettavuudesta, yhteentoimivuudesta ja uudelleenkäytettävyydestä – kaikki periaatteita, joita Tietoarkisto on edistänyt jo kohta kaksikymmentä vuotta ja vanhimmat yhteiskuntatieteelliset sisararkistomme (kuten brittien UKDS) jo puoli vuosisataa.

Vaikka kyse ei olekaan meille uudesta asiasta, FAIR-keskustelu on tarjonnut oivan herätteen tarkastella Tietoarkiston toimintaa hieman erilaisesta näkökulmasta. Yksi sysäys tarkastelullemme oli myös marraskuussa OpenAIRE2020-hankkeen järjestämä työpaja. Siellä FAIR-periaatteista keskusteltiin erilaisia tutkimuksen tukipalveluja vertailukohtana käyttäen. Tietoarkisto oli yksi mukana olleista palveluista.

Koska tarjoamme aineistojen arkistointi- ja avaamispalvelujen lisäksi neuvontaa ja ohjausta tutkimusdatan hallintaan (ks. tieteenala-asiantuntijamme Katja Fältin oiva katsaus olemassa oleviin aineistonhallinnan resursseihin ja palveluihin, onkin aiheellista ja reilua kysyä: Kuinka FAIR Tietoarkisto on?

Vastaukseni on, että Tietoarkisto on erittäin FAIR. Tässä tiivistetyt perustelut:

  • Tietoarkistoon arkistoidut aineistot on kuvailtu yksityiskohtaisesti. Metadata on vapaasti saatavilla ja hyödynnettävissä, vaikka datassa voi olla rajoituksia. Annamme aineistoille aina pysyvän tunnisteen. Aineistot ovat löydettävissä Tietoarkiston oman Aila-palveluportaalin kautta ja esimerkiksi myös kansallisten Finna- ja Etsin-palveluiden kautta.
  • Metadata on vapaasti saatavilla Ailan kautta sekä Tietoarkiston OAI-PMH-rajapinnasta. Rekisteröityneet käyttäjät voivat ladata dataa Ailasta. Aila hyödyntää HAKA-käyttäjätunnistusjärjestelmää.
  • Tietoarkisto käyttää aineistojen kuvailuun kansainvälistä DDI Codebook -kuvailuformaattia sekä useita kansainvälisiä sanastoja. Metadata sisältää myös viittauksia muuhun metadataan, dataan ja julkaisuihin. Data on saatavilla yhteiskuntatieteilijöiden yleisesti käyttämässä SPSS-formaatissa.
  • Aineistojen DDI Codebook -muotoinen metadata sisältää laajasti tietoa aineiston sisällöstä, tekijöistä, keruusta, muuttujista ja aineistoon viittaamisesta. Datan käyttöehdot ovat selkeät ja sisältyvät metadataan. Metadata on saatavilla CC-lisenssillä.

Tietoarkiston kannalta haasteellisin FAIR-periaate on yhteentoimivuus. FAIRin taustalla on idea koneellisesti saavutettavasta, käsiteltävästä ja tulkittavasta tiedosta. Se ei Tietoarkiston datan osalta toteudu täydellisesti, mutta mielestämme kuitenkin niin hyvin kuin on mahdollista ja tarkoituksenmukaista.

Marraskuun OpenAIRE2020-seminaarissa pohdittiinkin, mikä riittää siihen, että datan, organisaation tai palvelun voi sanoa olevan FAIR. Mitään yhtä vastausta tähän ei saatu – eikä mielestäni tarvitsekaan saada.

Esimerkiksi organisaatioiden toiminnan arviointiin on olemassa yksityiskohtaisia sertifikaatteja ja standardeja kuten OAIS, Data Seal of Approval ja ISO 16363. FAIR-periaatteet ovat sen sijaan iskevästi nimettyjä ja ilmaistuja yleisiä tavoitteita, ja ne toimivat sellaisina hyvin.

Tietoarkiston käytäntöjen FAIR-yhteensopivuus ei ollut yllätys, onhan meillä jo DSA-sertifikaatti. Aina on kuitenkin varaa parantaa, ja FAIR-periaatteet auttavat hahmottamaan, mitkä osa-alueet ovat vahvoja ja minkä osa-alueiden kehittämistä tulisi tutkiskella tarkemmin. Uskon, että FAIR-periaatteiden avulla on myös helppo herättää yleisempää keskustelua tutkimusaineistojen avaamisesta ja hallinnasta sekä niihin liittyvistä hyvistä käytännöistä.

Lisätietoa FAIR-periaatteista:
Wilkinson, Mark D. et al (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3, Article number 160018. http://dx.doi.org/10.1038/sdata.2016.18

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkisto on FAIR

Avoimen tieteen piirissä on viimeisen vuoden aikana alettu puhua FAIR-periaatteista. Kiinnostuksen selittänee pitkälti EU:n Horisontti 2020 -ohjelma, joka painottaa tutkimusaineistojen hyvää hallintaa ja FAIR-periaatteita.

FAIR on lyhenne sanoista Findable, Accessible, Interoperable ja Re-usable. Suomeksi voitaisiin puhua tutkimusaineistojen löydettävyydestä, saavutettavuudesta, yhteentoimivuudesta ja uudelleenkäytettävyydestä – kaikki periaatteita, joita Tietoarkisto on edistänyt jo kohta kaksikymmentä vuotta ja vanhimmat yhteiskuntatieteelliset sisararkistomme (kuten brittien UKDS) jo puoli vuosisataa.

Vaikka kyse ei olekaan meille uudesta asiasta, FAIR-keskustelu on tarjonnut oivan herätteen tarkastella Tietoarkiston toimintaa hieman erilaisesta näkökulmasta. Yksi sysäys tarkastelullemme oli myös marraskuussa OpenAIRE2020-hankkeen järjestämä työpaja. Siellä FAIR-periaatteista keskusteltiin erilaisia tutkimuksen tukipalveluja vertailukohtana käyttäen. Tietoarkisto oli yksi mukana olleista palveluista.

Koska tarjoamme aineistojen arkistointi- ja avaamispalvelujen lisäksi neuvontaa ja ohjausta tutkimusdatan hallintaan (ks. tieteenala-asiantuntijamme Katja Fältin oiva katsaus olemassa oleviin aineistonhallinnan resursseihin ja palveluihin, onkin aiheellista ja reilua kysyä: Kuinka FAIR Tietoarkisto on?

Vastaukseni on, että Tietoarkisto on erittäin FAIR. Tässä tiivistetyt perustelut:

  • Tietoarkistoon arkistoidut aineistot on kuvailtu yksityiskohtaisesti. Metadata on vapaasti saatavilla ja hyödynnettävissä, vaikka datassa voi olla rajoituksia. Annamme aineistoille aina pysyvän tunnisteen. Aineistot ovat löydettävissä Tietoarkiston oman Aila-palveluportaalin kautta ja esimerkiksi myös kansallisten Finna- ja Etsin-palveluiden kautta.
  • Metadata on vapaasti saatavilla Ailan kautta sekä Tietoarkiston OAI-PMH-rajapinnasta. Rekisteröityneet käyttäjät voivat ladata dataa Ailasta. Aila hyödyntää HAKA-käyttäjätunnistusjärjestelmää.
  • Tietoarkisto käyttää aineistojen kuvailuun kansainvälistä DDI Codebook -kuvailuformaattia sekä useita kansainvälisiä sanastoja. Metadata sisältää myös viittauksia muuhun metadataan, dataan ja julkaisuihin. Data on saatavilla yhteiskuntatieteilijöiden yleisesti käyttämässä SPSS-formaatissa.
  • Aineistojen DDI Codebook -muotoinen metadata sisältää laajasti tietoa aineiston sisällöstä, tekijöistä, keruusta, muuttujista ja aineistoon viittaamisesta. Datan käyttöehdot ovat selkeät ja sisältyvät metadataan. Metadata on saatavilla CC-lisenssillä.

Tietoarkiston kannalta haasteellisin FAIR-periaate on yhteentoimivuus. FAIRin taustalla on idea koneellisesti saavutettavasta, käsiteltävästä ja tulkittavasta tiedosta. Se ei Tietoarkiston datan osalta toteudu täydellisesti, mutta mielestämme kuitenkin niin hyvin kuin on mahdollista ja tarkoituksenmukaista.

Marraskuun OpenAIRE2020-seminaarissa pohdittiinkin, mikä riittää siihen, että datan, organisaation tai palvelun voi sanoa olevan FAIR. Mitään yhtä vastausta tähän ei saatu – eikä mielestäni tarvitsekaan saada.

Esimerkiksi organisaatioiden toiminnan arviointiin on olemassa yksityiskohtaisia sertifikaatteja ja standardeja kuten OAIS, Data Seal of Approval ja ISO 16363. FAIR-periaatteet ovat sen sijaan iskevästi nimettyjä ja ilmaistuja yleisiä tavoitteita, ja ne toimivat sellaisina hyvin.

Tietoarkiston käytäntöjen FAIR-yhteensopivuus ei ollut yllätys, onhan meillä jo DSA-sertifikaatti. Aina on kuitenkin varaa parantaa, ja FAIR-periaatteet auttavat hahmottamaan, mitkä osa-alueet ovat vahvoja ja minkä osa-alueiden kehittämistä tulisi tutkiskella tarkemmin. Uskon, että FAIR-periaatteiden avulla on myös helppo herättää yleisempää keskustelua tutkimusaineistojen avaamisesta ja hallinnasta sekä niihin liittyvistä hyvistä käytännöistä.

Lisätietoa FAIR-periaatteista:
Wilkinson, Mark D. et al (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3, Article number 160018. http://dx.doi.org/10.1038/sdata.2016.18

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.

DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi