Tag Archives: sanastot

FSD’s multilingual and qualitative data expertise brings in international visitors

During its 20 years of operation, FSD has established its status as a trusted partner in collaboration of data archives. On the initiative of our Japanese colleagues, we organised a seminar entitled Metadata, Data Catalogues and Tools for Findability in March.

The motivation for the seminar was a Japanese national project developing a joint data catalogue of several service providers. Our Japanese visitors chose to visit Finland and FSD because we have a long experience in successfully providing services in two languages, Finnish and English, as well as delivering metadata for harvesting by national and international joint catalogues.

We designed our presentations to answer the needs of our guests. FSD’s experts shared experiences of using the DDI-C metadata format, the process of joining national and international multidisciplinary catalogues, the significance and utilisation of controlled vocabularies, and the CoreTrustSeal certification, among others.

Professor Yukio Maeda presents JSPS’s plan for a federated data catalogue. Photo: Tuomas J. Alaterä

In addition to talks by FSD experts and our guests from Japan, the seminar featured presentations by the Director of CESSDA Ron Dekker and the Swedish National Data Service’s IT Systems Architect Olof Olsson. It is important for CESSDA to collaborate with organisations outside of Europe. The seminar in Tampere provided a good opportunity to share information about CESSDA strategy and objectives in responsible data sharing as well as the CESSDA Data Catalogue, which contains both FSD’s and SND’s metadata. SND makes use of the DDI-L format, and Olsson’s presentation on the topic offered a good comparison of two distinct metadata solutions. The presentation was also interesting from FSD’s systems development point of view.

Similar challenges

The seminar showed that the challenges of research data management and sharing are very similar everywhere. Similarly to Finland and Europe, researchers in Japan have a positive attitude towards data sharing in principle. However, when it comes to sharing their own data with others, they do not feel comfortable doing so or they prefer to share the data themselves rather than letting professionals do it for them. Our data acquisition team regularly encounters similar attitudes.

Seminar attendees. Photo: Misa Senbonmatsu

What also sounded familiar was the fact that the development of the data infrastructure is not actually nationally coordinated in Japan. Instead, the funder has opened a competition where different service providers are able to apply for funding for projects with certain pre-defined conditions. The big picture is then made up of what various organisations think is necessary and which project proposals the funder approves. Another thing to consider is how established the infrastructure operations will be after the funding period.

More information:

» DDI-C ja L documentation
» CESSDA ERIC
» Swedish National Data Service SND
» Japan Society for the Promotion of Science JSPS
» FSD metadata records in machine readable formats
» Data are described in the DDI format
» Vocabularies used in FSD’s data descriptions

Helena Laaksonen
director
firstname.surname [at] tuni.fi

This blog entry is also available in Finnish:
Monikielinen aineisto-osaaminen ja laadullisten aineistojen asiantuntemus tuovat kansainvälisiä vieraita Tietoarkistoon.

Monikielinen aineisto-osaaminen ja laadullisten aineistojen asiantuntemus tuovat kansainvälisiä vieraita Tietoarkistoon

Tietoarkisto on 20 toimintavuotensa aikana vakiinnuttanut asemansa luotettuna kumppanina data-arkistojen yhteistyössä. Maaliskuussa järjestimme japanilaisten kollegojen kanssa, heidän aloitteestaan, seminaarin Metadata, Data Catalogues and Tools for Findability.

Kansainvälisen seminaarin taustalla on Japanin kansallinen hanke, jossa he rakentavat usean palveluntarjoajan yhteistä aineistoluetteloa. Japanilaiset vieraat valitsivat Suomen ja Tietoarkiston vierailukohteekseen, koska Tietoarkistolla on pitkä kokemus onnistuneesta kaksikielisten palvelujen tuottamisesta suomeksi ja englanniksi sekä tutkimusaineistojen kuvailutietojen saattamisesta haravoitaviksi kansallisiin ja kansainvälisiin yhteisluetteloihin.

Tietoarkistossa koostimme oman osuutemme ohjelmaan vieraiden tiedontarpeesta lähtien. Tietoarkiston asiantuntijat kertoivat muun muassa DDI-C-kuvailuformaatin hyödyntämisestä Tietoarkistossa, liittymisestä kansallisiin ja kansainvälisiin monitieteisiin luetteloihin, monikielisten asiasanastojen merkityksestä ja hyödyntämisestä sekä CTS-sertifioinnista.

Professori Yukio Maeda esittelee JSPS:n suunnitelmaa yhteiskatalogiksi.
Kuva: Tuomas J. Alaterä

Seminaarissa esiintyivät Tietoarkiston asiantuntijoiden ja japanilaisten vieraiden lisäksi CESSDA ERICin johtaja Ron Dekker ja Ruotsin datapalvelun SND:n järjestelmäarkkitehti Olof Olsson. CESSDAlle on tärkeää luoda yhteistyösuhteita myös Euroopan ulkopuolelle. Tampereen seminaari antoi hyvän mahdollisuuden kertoa CESSDAn strategiasta ja tavoitteista tutkimusdatan vastuullisen avaamisen alalla, unohtamatta CESSDAn aineistoluetteloa, johon myös Tietoarkiston ja SND:n metadata haravoidaan. Ruotsin SND hyödyntää DDI-L-kuvailuformaattia. Olssonin esitys aiheesta tarjosi hyvän vertailukohdan kahden erilaisen metadataratkaisun välillä ja oli kiinnostava myös Tietoarkiston järjestelmäkehityksen näkökulmasta.

Samankaltaiset haasteet

Varsinaisen asiasisällön lisäksi seminaari osoitti kaikille osallistujille, että tutkimusaineistojen hallinnan ja avaamisen ongelmat ovat kaikkialla hyvin samanlaisia. Japanissakin tutkijat suhtautuvat periaatteessa myönteisesti, mutta eivät usein halua jakaa omaa dataansa muiden kanssa. Ja jos he haluavat, he usein tekevät sen mieluummin itse kuin antavat asiaan perehtyneiden ammattilaisten hoitaa tehtävän puolestaan. Tämä on Tietoarkiston aineistonhankinnassa tuttua.

Seminaariosallistujat. Kuva: Misa Senbonmatsu

Kovin tutulta vaikutti myös se, että datainfrastruktuurin rakentamista ei varsinaisesti koordinoida Japanissa kansallisesti. Rahoittaja on avannut kilpailun, josta eri palveluntarjoajat ovat voineet hakea rahoitusta tietyin ehdoin määritellyille hankkeille. Kansallinen kokonaiskuva rakentuu siitä, mitä erilliset organisaatiot pitävät tarpeellisena – ja mitä rahoittaja näistä esityksistä jatkoon valitsee. Perustamisvaiheen ohella pohdittavaa aiheuttaa infrastruktuurin toiminnan vakiinnuttaminen rahoituskauden päättyessä.

Lisätietoa:

» DDI-C ja L -dokumentaatio
» CESSDA ERIC
» Svensk nationell datatjänst SND
» Japan Society for the Promotion of Science JSPS
» Aineistokuvailut koneluettavissa formaateissa
» Aineistokuvailun DDI-formaatti
» Aineistonkuvailussa käytetyt sanastot

Helena Laaksonen
johtaja
etunimi.sukunimi [at] tuni.fi

Tämä blogikirjoitus on luettavissa myös englanniksi:
FSD’s multilingual and qualitative data expertise brings in international visitors.

Teema tiedossa, mutta aineisto hakusessa (ja mieli maassa)?

Tietoarkisto on uudistanut aineistovarantoaan esitteleviä teemasivuja. Aineistoja teemoittain -sivuilta löytyy nyt päivitetty kattaus hyvinvointia ja ihmissuhteita, kuntia, köyhyyttä, lapsia, lapsuutta ja perhettä, liikuntaa ja urheilua, maahanmuuttoa, ulkomaalaisia ja rasismia, median tutkimusta, nuorisotutkimusta, terveyttä, työelämän tutkimusta, uskontoa, uskonnollisuutta ja kirkkoja, vaaleja, vanhuutta ja vanhenemista sekä ympäristöä ja energiaa luotaavia aineistovinkkejä. Ja lisää on luvassa. Aivan uusiksi teemakokonaisuuksiksi ovat lähiaikoina tulossa ainakin seksuaalisuus sekä alkoholi ja muut päihteet.

(Älä huoli. Asioilla on taipumus järjestyä. Etsi, pyydä ja ota vastaan apua!) Tietoarkisto neuvoo ja auttaa muun muassa tutkimusaineistojen haussa ja käytössä. Pääpaino on Tietoarkiston kotimaisissa tutkimusaineistoissa, mutta ohjaamme myös ulkomaisten aineistojen lähteille.

Ensimmäiset teemasivumme syntyivät aikoinaan vastauksena asiakkaidemme toiveisiin, tietopalveluna. Meitä pyydettiin seminaareihin ja opintojaksoille esittelemään tutkimusaineistojamme esimerkiksi nuorisotutkimuksen ja työelämän tutkimuksen saroilta. Sinäkin voit vinkata uusia teemasivu-aihioita! Ota yhteyttä asiakaspalveluumme.

Aineistoja teemoittain -sivut auttavat opiskelijoita, opettajia ja tutkijoita löytämään nopeammin ja helpommin eri aihe-alueisiin liittyviä tutkimusaineistoja. Uusimmat aineistot poimitaan teemasivuille automaattisesti aineistovarannostamme asiasanojen perusteella. Tietoarkistoon tallennettavien tutkimusaineistojen sisältö kuvaillaan kattavasti muun muassa lukuisilla laajasti käytetyillä sanastoilla ja luokituksilla. Suomenkielisten aineistojemme asiasanoituksessa käytämme Yleistä suomalaista asiasanastoa. Tietoarkistolaiset nostavat teemasivuilla uusien aineistojen ohella esiin myös aihe-aluetta kartoittavia aineistosarjoja ja yksittäisiä, tutustumisen arvoisia aineistoja. Tutustu siis niihin!

Teemasivut ovat yksi portti laajaan aineistovarantoomme. Avaa portti ja astu sisään.

Linkkejä ja lisätietoa:
» Aineistoja teemoittain
» Tietoarkiston tietopalvelu
» Yleinen suomalainen asiasanasto
» Yhteystiedot

Hannele Keckman-Koivuniemi
Tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

Teema tiedossa, mutta aineisto hakusessa (ja mieli maassa)?

Tietoarkisto on uudistanut aineistovarantoaan esitteleviä teemasivuja. Aineistoja teemoittain -sivuilta löytyy nyt päivitetty kattaus hyvinvointia ja ihmissuhteita, kuntia, köyhyyttä, lapsia, lapsuutta ja perhettä, liikuntaa ja urheilua, maahanmuuttoa, ulkomaalaisia ja rasismia, median tutkimusta, nuorisotutkimusta, terveyttä, työelämän tutkimusta, uskontoa, uskonnollisuutta ja kirkkoja, vaaleja, vanhuutta ja vanhenemista sekä ympäristöä ja energiaa luotaavia aineistovinkkejä. Ja lisää on luvassa. Aivan uusiksi teemakokonaisuuksiksi ovat lähiaikoina tulossa ainakin seksuaalisuus sekä alkoholi ja muut päihteet.

(Älä huoli. Asioilla on taipumus järjestyä. Etsi, pyydä ja ota vastaan apua!) Tietoarkisto neuvoo ja auttaa muun muassa tutkimusaineistojen haussa ja käytössä. Pääpaino on Tietoarkiston kotimaisissa tutkimusaineistoissa, mutta ohjaamme myös ulkomaisten aineistojen lähteille.

Ensimmäiset teemasivumme syntyivät aikoinaan vastauksena asiakkaidemme toiveisiin, tietopalveluna. Meitä pyydettiin seminaareihin ja opintojaksoille esittelemään tutkimusaineistojamme esimerkiksi nuorisotutkimuksen ja työelämän tutkimuksen saroilta. Sinäkin voit vinkata uusia teemasivu-aihioita! Ota yhteyttä asiakaspalveluumme.

Aineistoja teemoittain -sivut auttavat opiskelijoita, opettajia ja tutkijoita löytämään nopeammin ja helpommin eri aihe-alueisiin liittyviä tutkimusaineistoja. Uusimmat aineistot poimitaan teemasivuille automaattisesti aineistovarannostamme asiasanojen perusteella. Tietoarkistoon tallennettavien tutkimusaineistojen sisältö kuvaillaan kattavasti muun muassa lukuisilla laajasti käytetyillä sanastoilla ja luokituksilla. Suomenkielisten aineistojemme asiasanoituksessa käytämme Yleistä suomalaista asiasanastoa. Tietoarkistolaiset nostavat teemasivuilla uusien aineistojen ohella esiin myös aihe-aluetta kartoittavia aineistosarjoja ja yksittäisiä, tutustumisen arvoisia aineistoja. Tutustu siis niihin!

Teemasivut ovat yksi portti laajaan aineistovarantoomme. Avaa portti ja astu sisään.

Linkkejä ja lisätietoa:
» Aineistoja teemoittain
» Tietoarkiston tietopalvelu
» Yleinen suomalainen asiasanasto
» Yhteystiedot

Hannele Keckman-Koivuniemi
Tietopalvelupäällikkö
etunimi.sukunimi [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi