Tag Archives: tukipalvelut

Translation and international use of research data

To promote open science, the Finnish Social Science Data Archive also provides services to researchers and students who do not speak Finnish. In practice, this means that foreign language speakers are provided the opportunity to access quantitative research data in FSD holdings in English. In addition, we describe all data in English to allow the international audience to find them.

Translating variables, that is, the questions and response alternatives presented in a study, differs quite a lot from translating other types of texts. Translators of literature often have a great deal of linguistic and artistic freedom. The challenge of translating fiction usually lies in carrying the ambiguities of the source language over to the target language. Translating technical and informative texts requires clearer, more univocal interpretation, although depending on the text type a translator may have some creative licence.

Striving for fidelity and clarity

When survey questions are being translated, there’s very little room for interpretation. In studying attitudes, how something is asked may have almost as big an effect on the frequency distributions as what is asked.1 The users of translated data have to be able to trust that the translated questions correspond to the original ones as closely as possible in terms of both content and form. Researchers may draw far-reaching conclusions based on the translated questions, which is why it’s essential that non-Finnish-speaking researchers gain an understanding of what the respondents were originally asked and how the questions were phrased.

One of the challenges of translating variables faithfully is posed by the errors and inconsistencies sometimes found in source texts. At its worst, an error in a Finnish question may affect how the respondents answer the question, and the non-Finnish user of the data will wonder what has caused the unexpected frequency distributions. When translators notice an error, they have to consider how significant it is and whether it has actually affected the responses. The translator also needs to decide how to communicate the error to data users. Replicating the error in the translation is rarely a good option because a user won’t know whether the error originated from the source text or the translator.

As translators at FSD, we’re lucky to have the possibility to provide further information on the translations to users through a separate file. These translation notes usually contain information on the word choices and translation strategies used.

Culture-specific expressions pose challenges

In general, a translator of research data should aim to create as neutral a translation as possible while avoiding interpreting variables too strictly from her or his own point of view. However, this does not mean that we translate data word for word; relaying the idea of the original text clearly and intelligibly is our priority.

Ultimately, the challenges of data translations are very similar to those encountered when translating other kinds of texts, such as how to express a concept that does not exist in another language and how to translate the nuances of the source language into the target language.

Questions presented in surveys often have elements or expressions that are specific to the Finnish culture and have no obvious counterparts in English. In these cases, the concepts need to be explained to foreign users. For example, in one dataset, the respondents were asked whether ”red cottages and potato fields” are part of the Finnish rural landscape. This expression is similar to the ”white picket fence” used in the United States referring to a sort of simple and idyllic life. However, because our users are from all over the world, domesticating the question for a culturally limited audience is not a good idea. For users who are not familiar with either the Finnish or the American culture, we would simply be replacing one culture-specific expression with another. In situations like this, the translation notes are of great help to us, as we are able to explain expressions that might otherwise be incomprehensible to some users.

The translation process at FSD usually takes a few weeks depending on the size of the data and the translators’ workload. After the translation is complete, the data are available on our Aila Data Service to all users who need it in English. This is why we always put a lot of care and effort in translating all of the data instead of specific, individual variables needed by one user.

”Haste makes waste” also applies to questionnaire design and translation

Some might say that a data translation is never close enough to the source text to make research on translated variables feasible. It’s been noted, for example, that some established measurements of well-being do in fact measure slightly different concepts in different languages.2 Full equivalence can perhaps never be achieved, but this is rarely the goal of translation. It’s good to remember that language is built on interpretations, and even speakers of the same language may understand the same question in different ways in attitudinal surveys.

Questionnaire design and translation do not always receive the attention they deserve, although well-formed questions are likely to lead to better validity. In international comparative surveys, it’s particularly important that all respondents are asked the same things in the same way. If you plan to use questionnaires in more than one language, having questionnaires translated by a professional translator is something to consider when planning data collection. Surveys conducted in a single language also benefit from proofreading by a professional to prevent potential errors or inconsistencies from endangering the objective of the study.

Survey question form and wording require some effort, but there is no need to reinvent the wheel; inspiration for questions can be found, for example, in the UKDS Variable and question bank, the upcoming CESSDA Euro Question Bank and of course our question and variable search on Aila Data Service.

Henri Ala-Lahti
Research Officer
firstname.lastname [at] uta.fi

Niko Koski
Research Assistant
firstname.lastname [at] uta.fi


1 Schuman, Howard & Stanley Presser (1996), Questions and Answers in Attitude Surveys: Experiments on Question Form, Wording, and Context. Thousand Oaks: SAGE
2 Lolle, Henrik Lauridsen & Jørgen Goul Andersen (2015), ”Measuring Happiness and Overall Life Satisfaction: A Danish Survey Experiment on the Impact of Language and Translation Problems”, Journal of Happiness Studies 17 (4): 1337-1350.

This blog entry is also available in Finnish:
Suomenkielisten tutkimusaineistojen kääntämisestä ja kansainvälisestä jatkokäytöstä.

Suomenkielisten tutkimusaineistojen kääntämisestä ja kansainvälisestä jatkokäytöstä

Tietoarkisto palvelee avoimen tieteen edistämiseksi myös tutkijoita ja opiskelijoita, jotka eivät puhu suomea. Käytännössä tämä tarkoittaa sitä, että Suomessa tai ulkomailla asuville vieraskielisille asiakkaille tarjotaan mahdollisuus saada käyttöönsä kvantitatiiviset tutkimusaineistot englanninkielisinä. Lisäksi tuotamme kaikista arkistoon toimitetuista aineistoista kuvailut englanniksi, jotta kansainvälinen yleisö löytäisi tarvitsemansa aineistot.

Aineiston muuttujien eli tutkimuksissa esitettyjen kysymysten ja niiden vastausvaihtoehtojen kääntäminen poikkeaa varsin paljon muiden tekstien kääntämisestä. Kaunokirjallisten tekstien kääntäjällä on suuri vapaus ilmaista asia toisella kielellä. Kaunokirjallisuuden kääntämisen haasteena on usein alkuperäisen tekstin moniselitteisyys ja tämän välittäminen kohdekielelle. Asiatekstikääntäminen taas vaatii yksiselitteisempää ilmaisutapaa, vaikka tekstilajista riippuen myös asiatekstikäännöksissä on paikoitellen ilmaisunvapautta.

Tasapainottelua vastaavuuden ja selkeyden välillä

Tutkimusaineistojen kysymysten kääntäminen sijoittuu ilmaisutavan puolesta asiatekstien tiukempaan päähän. Asenteita tutkittaessa muuttujien jakaumiin voivat vaikuttaa paitsi kysymysten ajatuksellinen sisältö myös niiden esitystapa.1 Käännettyjen tutkimusaineistojen käyttäjien on voitava luottaa siihen, että käännetyt kysymykset vastaavat sisällöltään ja esitystavaltaan mahdollisimman läheisesti tutkittaville esitettyjä. Tutkijat voivat tehdä pitkällekin meneviä johtopäätöksiä käännettyjen kysymysten perusteella. Siksi on tärkeää, että ulkomaalainen tutkija saa oikean käsityksen siitä, mitä vastaajilta on kysytty suomeksi.

Eräänä haasteena uskollisen muuttujakäännöksen tuottamiselle ovat alkuperäisissä teksteissä silloin tällöin esiintyvät virheet ja epäjohdonmukaisuudet. Pahimmillaan suomenkielisessä kysymyksessä esiintynyt virhe on voinut vaikuttaa siihen, miten tutkittavat ovat vastanneet kysymykseen, ja muun kielinen jatkokäyttäjä voi ihmetellä, mistä epäuskottavat frekvenssijakaumat mahtavat johtua. Kääntäjän onkin tällaisissa tilanteissa punnittava, kuinka merkittävä virhe on ja onko se saattanut vaikuttaa kysymyksen tulkintaan. Tämän lisäksi on mietittävä, kuinka tulkintaan mahdollisesti vaikuttanut virhe ilmaistaan tutkimusaineistoa käyttävälle asiakkaalle. Virheen toistaminen käännöksessä on harvoin hyvä vaihtoehto, sillä asiakas ei voi tietää, onko kyseessä kääntäjän vai alkuperäistekstin virhe.

Me Tietoarkiston kääntäjät olemme siinä mielessä onnellisessa asemassa, että meillä on mahdollisuus liittää kääntämiemme aineistojen yhteyteen lisätietoja käännöksistä. Lisätiedot kootaan yleensä erilliseen tekstitiedostoon, johon kääntäjät voivat myös kommentoida terminologiavalintojaan ja käyttämiään käännösstrategioita.

Kulttuurisidonnaiset ilmaisut vaativat pohdintaa

Yleisesti ottaen kääntäjän on vältettävä tulkitsemasta muuttujia omasta näkökulmastaan ja pyrittävä mahdollisimman neutraaliin käännökseen. Tämä ei kuitenkaan tarkoita, että tutkimusaineisto käännettäisiin suoraan sanasta sanaan, vaan etusijalla ovat aina tekstin ymmärrettävyys ja tekstin ajatuksen välittäminen kielestä ja kulttuurista toiseen. Tutkimusaineistojen kääntämisessä ollaan lopulta samankaltaisten haasteiden äärellä kuin muidenkin tekstien kääntämisessä, eli kuinka ilmaista toisesta kielestä tai kulttuurista kokonaan puuttuva käsite tai ilmaus ja kuinka siirtää lähtötekstin vivahteet toiselle kielelle.

Tutkimuksissa esitetyt kysymykset sisältävät usein kulttuurisidonnaisia elementtejä, joille ei ole olemassa termejä englanniksi. Tällöin termien käsitesisällöt täytyy selittää auki ulkomaalaiselle jatkokäyttäjälle. Esimerkiksi eräässä aineistossa vastaajilta kysyttiin sitä, kuuluvatko ”punaiset tuvat ja perunamaat” suomalaiseen maaseutumaisemaan. Ilmaus on hyvin kulttuurisidonnainen, ja vaikka sille löytyisikin vastineita joistakin kulttuureista, on otettava huomioon, että asiakkaamme voivat olla mistä päin maailmaa tahansa. Siksi kysymyksen niin sanottu kotouttaminen yhteen kulttuuriin tai maahan, vaikkapa yhdysvaltalaisille tutulla kielikuvalla, ei ole suositeltavaa. Myös tässä tapauksessa on suureksi avuksi, että voimme toimittaa asiakkaalle lisätietoja käännöksestä ja selittää esimerkiksi, että punainen tupa ja perunamaa ymmärretään Suomessa usein eräänlaisena maalaisidyllinä.

Tietoarkiston käännösprosessi vie aineiston koosta ja kääntäjien työmäärästä riippuen yleensä muutaman viikon, jonka jälkeen aineisto on muidenkin englanninkielistä aineistoa tarvitsevien käytössä Aila-palvelun kautta. Tämän vuoksi aineistot käännetään aina huolellisesti kokonaan.

Kyselylomakkeita ei kannata kääntää hätäillen

Joidenkin mielestä käännöksellä ei koskaan päästä niin lähelle alkuperäisen tekstin merkitystä, että erikielisten muuttujien vertailu tutkimuksessa olisi mielekästä. Eräät tutkijat ovat esimerkiksi huomauttaneet, että usein käytetyt hyvinvoinnin mittarit mittaavat itse asiassa eri asioita eri kielillä.2 Täydellistä kielten välistä vastaavuutta tuskin saavutetaan käännöksellä juuri koskaan, ja se on harvoin kääntämisen tavoite. On hyvä muistaa, että kieli rakentuu erilaisten tulkintojen varaan. Kyselytutkimuksissa mitataan yleensä vastaajien asenteita ja näkemyksiä, ja samaa kieltä puhuvatkin voivat ymmärtää saman kysymyksen eri tavoin.

Aina kyselylomakkeiden huolellista laatimista ja kääntämistä ei nähdä tutkimuksen kannalta oleellisena, vaikka oikein muotoilluilla kysymyksillä on merkitystä kyselyn tulosten validiteetin kannalta. Kansainvälisissä vertailuaineistoissa on erityisen tärkeää, että eri kielillä käytettävissä kyselylomakkeissa kysytään mahdollisimman tarkasti samoja asioita. Kyselylomakkeiden käännättäminen ammattikääntäjällä kannattaa ottaa huomioon jo aineistonkeruuta suunnitellessa, jos kyselylomakkeita aiotaan käyttää muulla kielellä kuin suomeksi. Suomeksikin kysymysten kieliasu kannattaa tarkistuttaa, jotta heikko tai epäjohdonmukainen kieli ei vaaranna tutkimuksen tavoitteita.

Kysymysten muotoilussa täytyy siis olla tarkka ja huolellinen niin suomeksi kuin englanniksikin. Pyörää ei tarvitse kuitenkaan keksiä uudelleen; suomeksi kysymyslomakkeita muotoillessa kannattaa käyttää hyväksi palveluportaali Ailan muuttujahakua ja etsiä esimerkkejä aiemmin käytetyistä kysymyksistä, ja englanniksi voi hyödyntää esimerkiksi UKDS:n kysymyspankkia sekä CESSDAn tulevaa Euro Question Bankia.

Henri Ala-Lahti
tutkimusamanuenssi
etunimi.sukunimi [at] uta.fi

Niko Koski
tutkimusapulainen
etunimi.sukunimi [at] uta.fi


1 Schuman, Howard & Stanley Presser (1996), Questions and Answers in Attitude Surveys: Experiments on Question Form, Wording, and Context. Thousand Oaks: SAGE
2 Lolle, Henrik Lauridsen & Jørgen Goul Andersen (2015), ”Measuring Happiness and Overall Life Satisfaction: A Danish Survey Experiment on the Impact of Language and Translation Problems”, Journal of Happiness Studies 17 (4): 1337-1350.

Tämä blogikirjoitus on luettavissa myös englanniksi:
Translation and international use of research data.

Ensikokemuksia kirjoitusaineistojen keruutyökalu Pennasta

Tietoarkisto lanseerasi syksyllä 2017 uuden kirjoitusaineistojen keruutyökalu Pennan. Pennan tarkoituksena on tarjota aineistonsa arkistoiville tutkijoille ja opiskelijoille helppo tapa kerätä kirjoitusaineistoja. Päädyimme täysin uuden palvelun luomiseen havaittuamme, että opiskelijat ja tutkijat käyttävät arkistoituja kirjoitusaineistoja hyvinkin paljon, mutta niitä keräävät lähinnä vain isommat organisaatiot ja eri alojen järjestöt.

Tulkitsimme, että tutkijat ja opiskelijat pitivät kirjoitusaineistoja kiinnostavana ja tutkimuksellisesti rikkaana aineistotyyppinä, mutta keruiden järjestäminen ja tekninen hallinta koettiin jossain määrin hankalaksi. Haastetta lisää se, että erityisesti kaikelle kansalle suunnatuissa kirjoituskeruissa on vaikea etukäteen arvioida, kuinka suureksi aineistomäärät lopulta kasvavat.

Pennan julkaisun jälkeen kirjoitusaineistojen keruu on helpottunut, sillä Tietoarkisto hoitaa keruun teknisen toteutuksen ja kirjoitusten tietoturvallisen säilytyksen. Tutkijan itsensä tarvitsee ainoastaan laatia kirjoituskutsu ja tiedottaa keruusta valitsemalleen kohderyhmälle.

Tietoarkisto luo tutkijan laatiman kirjoituskutsun pohjalta Pennaan keruulomakkeen ja lisää lomakkeeseen tarvittavat taustatietokysymykset. Tämän jälkeen tutkija saa Tietoarkistolta keruulinkin, jota hän voi levittää parhaiksi katsomissaan kanavissa. Kun keruu on päättynyt, Tietoarkisto toimittaa kirjoitukset tutkijalle txt-muodossa zip-pakettina. Tietoarkistoon arkistoitavat kirjoitukset tulevat sovitun ajan kuluttua jatkokäytettäviksi palveluportaali Ailaan aineiston käyttöehtojen mukaisesti.

Koska Tietoarkisto vastaa keruun teknisestä toteutuksesta, voidaan samalla varmistaa kirjoitusaineistojen ongelmaton arkistointi tietosuojalainsäädännön ja tutkimusetiikan näkökulmasta. Jokaisessa keruussa tutkittavia informoidaan asianmukaisesti aineiston käytöstä sekä kysytään lupa kirjoituksen arkistointiin ja jatkokäyttöön.

Ensimmäiset keruut ovat onnistuneet

Nyt Penna on ollut käytössä vajaan vuoden ja ensimmäiset kuusi keruuta on järjestetty. Jo nyt Pennalla on kerätty vastaajien kokemuksia hyvin erilaisista aiheista. Aineistoja on kerätty muun muassa liittyen opiskelijoiden hyvinvointiin, sukupuolen merkitykseen opetuksessa sekä ilman parisuhdetta elävien miesten elämään.

Ensimmäisten keruiden jälkeen voimme myös jo hieman tarkastella keruista saatuja kokemuksia. Yleisesti ottaen ensikokemukset Pennasta ovat olleet erittäin hyviä. Pennaa käyttäneet tutkijat ovat olleet tyytyväisiä uuden keruualustan tarjoamiin mahdollisuuksiin ja moni on ollut yllättynyt, kuinka vaivatta keruun järjestäminen on onnistunut.

Hyvien kokemusten innoittamana Tietoarkisto esitteli toukokuun lopussa Pennaa myös data-arkistointi- ja tietopalvelualan kansainvälisen IASSIST-järjestön vuosittaisessa päätapahtumassa, joka järjestettiin tänä vuonna Montrealissa Kanadassa. Myös siellä oltiin kiinnostuneita uudesta palvelusta.

Hyvä tiedotus onnistuneen keruun avain

Vaikka Pennan ansiosta keruiden tekninen toteutus onkin nyt helppoa, ei pelkkä Pennan olemassaolo vielä takaa keruun onnistumista. Suurimmassa vastuussa on edelleen tutkija itse, sillä keruusta tiedottaminen on yksinomaan tutkijan vastuulla. Lähes kaikissa tähänastisista keruista tutkimuksen kohderyhmänä on ollut jokin erityinen väestönryhmä, ei koko väestö. Koska tällaisissa keruissa tavoitellut vastaajamäärät ovat jo lähtökohtaisesti varsin kohtuullisia, vaikuttaa keruun onnistumiseen olennaisesti tiedotuksen hyvä suunnittelu ja oikeiden tiedotuskanavien löytäminen.

Tiedottamisen merkitystä korostaa myös toinen ensimmäisistä keruista tekemämme havainto. Keruuajan pidentäminen kesken keruun ei ole lisännyt vastausmääriä käytännössä lainkaan, ellei tiedottamista ei samalla ole tehostettu. Lisäksi niissä keruissa, joissa tiedämme keruutiedotteiden lähettämisajankohdan, vastausmäärät ovat aina selvästi nousseet hetkellisesti tiedotteen lähettämistä seuraavina päivinä. Vastaavasti keruissa, joissa keruutiedote on lähetetty vain kertaalleen keruun alussa, vastausmäärät ovat alun piikin jälkeen kuihtuneet riippumatta siitä, kuinka pitkään keruu on ollut auki.

Vaikka jokainen keruu on aina erilainen, emmekä muutaman yksittäisen keruun jälkeen voi yleistää liikaa, ovat tähänastiset keruut kuitenkin selvästi osoittaneet hyvän tiedottamisen tärkeyden onnistuneessa kirjoituskeruussa.

Kehitystarpeita

Ensimmäiset Pennalla toteutetut keruut synnyttivät myös kehitysideoita. Esiin nousi muun muassa toive siitä, että aineistonkerääjät voisivat itse reaaliaikaisesti seurata oman keruunsa vastaussaldon kehittymistä. Tällä hetkellä Tietoarkisto lähettää tutkijalle tiedon vastaussaldosta keruun pituudesta riippuen noin viikon tai kahden välein sekä aina pyydettäessä. Tutkijan kannalta olisi parempi, että hän voisi seurata vastaussaldonsa kehittymistä reaaliaikaisesti. Tällöin hän voisi esimerkiksi tarvittaessa tehostaa tiedottamistaan tekemiensä havaintojen perusteella.

Toinen konkreettinen tarve olisi tehdä Pennasta myös englanninkielinen versio, jotta myös muut kuin suomenkieliset tutkijat ja vastaajat voisivat käyttää Pennaa täysipainoisesti. Nykyään keruulomakkeen voi kyllä tehdä muullakin kuin suomenkielellä, mutta Pennan ohjeet ja muut tekstit ovat vain suomeksi.

Kaikki käyttäjien palautteet sekä omat havaintomme Pennan kehittämiseksi kirjataan ja niiden toteuttamismahdollisuuksia kartoitetaan Pennan tulevien päivitysten yhteydessä. Toivomme, että voimme myös edellä mainitut toiveet toteutettua mahdollisimman pian.

Käyttäkää Pennaa, olkaa hyvä!

Pennasta tähän mennessä saatujen kokemusten perusteella uskallan vilpittömästi suositella Pennaa kaikille, jotka haluavat kerätä oman kirjoitusaineiston tutkimustansa varten. Pennan käyttö on tutkijoille ja opiskelijoille täysin ilmaista. Lisätietoa Pennasta löytyy Tietoarkiston verkkosivuilta. Voit myös olla suoraan yhteydessä Tietoarkiston asiakaspalveluun.

Lisätietoa:

» Kirjoitusaineistojen keruutyökalu Penna
» Lisää Penna-palvelusta
» asiakaspalvelu.fsd [at] uta.fi

Jarkko Päivärinta
tietopalveluasiantuntija
etunimi.sukunimi [at] uta.fi

Näkemiin

Tietoarkiston työntekijät lienevät rasitukseenkin saakka kuulleet kertaustani yksikkömme synnystä. 1990-luvun puolivälissä Suomen Akatemian tietoarkistotyöryhmä esitti yksikön perustamista Suomeen; joko Helsingin, Tampereen tai Turun yliopistojen yhteyteen. Tampere ja Turku osallistuivat kilpailutukseen, mutta Helsingistä ei tarjousta tullut.

Opetusministeri Olli-Pekka Heinonen päätti arkiston sijoittamisesta Tampereelle syksyllä 1997. Kun rahaa yksikön toiminnan välittömään käynnistämiseen ei ollut, suunnittelua jatkettiin Tampereen yliopistossa OPM:n projektirahoituksen turvin vuoden 1998 loppuun. Toiminta käynnistyi vuoden 1999 alussa Tampereen yliopiston erillisenä laitoksena ja valtakunnallisena tehtävänä.

Sijoituspäätöksen jälkeen minua pyydettiin hankkeen jatkosuunnittelun asiantuntijasihteeriksi, ilmeisesti lähinnä kahdesta syystä. Työskentelin oikeassa paikassa ja tutkimusalalla, joka oli kiinteästi yhteydessä data-arkistoihin.

Tampereen yliopistossa yksikön perustamisen jatkosuunnittelu osoitettiin silloiselle yhteiskuntatieteiden tutkimuslaitokselle, jossa olin työskennellyt jo monta vuotta Suomen Akatemian rahoittamana projekti- ja virkatutkijana. Olin tohtoroitunut vuonna 1996 ja survey-aineistojen keruu- ja käyttökokemusta oli kertynyt rutkasti Pertti Pesosen ja Risto Sänkiahon johtamissa vaalitutkimuksissa. Hain ja tulin valituksi yksikön johtajaksi.

En muista epäröineeni hetkeäkään lähtemistä tietoarkistotielle, enkä ole tuota päätöstä katunut. Nyt, lähes 20 vuotta myöhemmin, jätän Tietoarkiston johtajan pestin hyvillä mielin palatakseni tutkimusuralle, aluksi projektirahoituksella. Lähden Tietoarkistosta mutta Tietoarkisto ei lähde minusta. Ikääntynyt kahvimukini on nostettu yksikön kahvihuoneen kattoon. Elämä ja myös kahvin juonti jatkuvat.

Koen olevani etuoikeutettu päästyäni mukaan rakentamaan Suomeen kokonaan uuden akateemisen palveluyksikön. Mikä Tietoarkisto siitä muodostuikaan yhdessä loistavien työtovereiden, kaikkien Tietoarkistossa työskentelevien ja työskennelleiden, kanssa! Olemme luoneet akateemista tutkimusta, opetusta ja opiskelua monipuolisesti hyödyttäviä palveluja ja olleet kiistatta uranuurtajia tutkimusdatan arkistoinnissa ja jatkokäytön mahdollistamisessa. Työ jatkuu ja menestyy. Sen takaavat asiantunteva henkilöstö sekä tiivis kansallinen ja kansainvälinen yhteistyö.

Kiitän henkilökunnan lisäksi kaikkia Tietoarkiston kehittämiseen tähän saakka osallistuneita henkilöitä ja tahoja. Tietoarkisto tarvitsee tukeanne edelleen.

Omat tuntemukseni ovat toki haikeita mutta samalla hyvin luottavaisia. Väkemme tietää mitä tehdä. Jäähyväisblogini päätän kirjoittamani läksiäislaulun kakkossäkeistöön ja kertsiin. Laulun nimi on Näkemiin.

Älä luule että risteyksen rakensin
jotta mennyttä saisin mä surra
Joskus tuulesta kuulee vaan paremmin
minnekä mennä ja tulla

Älä usko etten sinua kaipaamaan jää
etten kaunista muistelisi
ettei päivämme kävisi mielessäkään
eikä tiet enää kohtaisi

Tää ei oo hyvästi vaan tää on näkemiin
en siis kättäni nosta merkiksi
vaikka palaakaan en — niin jäähyväisiin
tuskin kunnolla aihetta olisi

Sami Borg
Tietoarkiston ex-johtaja 1.1.2017 alkaen
etunimi.sukunimi [at] uta.fi

Näkemiin

Tietoarkiston työntekijät lienevät rasitukseenkin saakka kuulleet kertaustani yksikkömme synnystä. 1990-luvun puolivälissä Suomen Akatemian tietoarkistotyöryhmä esitti yksikön perustamista Suomeen; joko Helsingin, Tampereen tai Turun yliopistojen yhteyteen. Tampere ja Turku osallistuivat kilpailutukseen, mutta Helsingistä ei tarjousta tullut.

Opetusministeri Olli-Pekka Heinonen päätti arkiston sijoittamisesta Tampereelle syksyllä 1997. Kun rahaa yksikön toiminnan välittömään käynnistämiseen ei ollut, suunnittelua jatkettiin Tampereen yliopistossa OPM:n projektirahoituksen turvin vuoden 1998 loppuun. Toiminta käynnistyi vuoden 1999 alussa Tampereen yliopiston erillisenä laitoksena ja valtakunnallisena tehtävänä.

Sijoituspäätöksen jälkeen minua pyydettiin hankkeen jatkosuunnittelun asiantuntijasihteeriksi, ilmeisesti lähinnä kahdesta syystä. Työskentelin oikeassa paikassa ja tutkimusalalla, joka oli kiinteästi yhteydessä data-arkistoihin.

Tampereen yliopistossa yksikön perustamisen jatkosuunnittelu osoitettiin silloiselle yhteiskuntatieteiden tutkimuslaitokselle, jossa olin työskennellyt jo monta vuotta Suomen Akatemian rahoittamana projekti- ja virkatutkijana. Olin tohtoroitunut vuonna 1996 ja survey-aineistojen keruu- ja käyttökokemusta oli kertynyt rutkasti Pertti Pesosen ja Risto Sänkiahon johtamissa vaalitutkimuksissa. Hain ja tulin valituksi yksikön johtajaksi.

En muista epäröineeni hetkeäkään lähtemistä tietoarkistotielle, enkä ole tuota päätöstä katunut. Nyt, lähes 20 vuotta myöhemmin, jätän Tietoarkiston johtajan pestin hyvillä mielin palatakseni tutkimusuralle, aluksi projektirahoituksella. Lähden Tietoarkistosta mutta Tietoarkisto ei lähde minusta. Ikääntynyt kahvimukini on nostettu yksikön kahvihuoneen kattoon. Elämä ja myös kahvin juonti jatkuvat.

Koen olevani etuoikeutettu päästyäni mukaan rakentamaan Suomeen kokonaan uuden akateemisen palveluyksikön. Mikä Tietoarkisto siitä muodostuikaan yhdessä loistavien työtovereiden, kaikkien Tietoarkistossa työskentelevien ja työskennelleiden, kanssa! Olemme luoneet akateemista tutkimusta, opetusta ja opiskelua monipuolisesti hyödyttäviä palveluja ja olleet kiistatta uranuurtajia tutkimusdatan arkistoinnissa ja jatkokäytön mahdollistamisessa. Työ jatkuu ja menestyy. Sen takaavat asiantunteva henkilöstö sekä tiivis kansallinen ja kansainvälinen yhteistyö.

Kiitän henkilökunnan lisäksi kaikkia Tietoarkiston kehittämiseen tähän saakka osallistuneita henkilöitä ja tahoja. Tietoarkisto tarvitsee tukeanne edelleen.

Omat tuntemukseni ovat toki haikeita mutta samalla hyvin luottavaisia. Väkemme tietää mitä tehdä. Jäähyväisblogini päätän kirjoittamani läksiäislaulun kakkossäkeistöön ja kertsiin. Laulun nimi on Näkemiin.

Älä luule että risteyksen rakensin
jotta mennyttä saisin mä surra
Joskus tuulesta kuulee vaan paremmin
minnekä mennä ja tulla

Älä usko etten sinua kaipaamaan jää
etten kaunista muistelisi
ettei päivämme kävisi mielessäkään
eikä tiet enää kohtaisi

Tää ei oo hyvästi vaan tää on näkemiin
en siis kättäni nosta merkiksi
vaikka palaakaan en — niin jäähyväisiin
tuskin kunnolla aihetta olisi

Sami Borg
Tietoarkiston ex-johtaja 1.1.2017 alkaen
etunimi.sukunimi [at] uta.fi

Tietoarkisto on aktiivinen eurooppalainen osaaja

Tietoarkisto on CESSDAn Suomen kansallinen palveluntuottaja. Tämä lyhyt toteamus pitää sisällään paljon hankkeita ja paljon työtä – sekä runsaasti puhelin- ja videokokouksia, onhan kysymys yhteiseurooppalaisesta toiminnasta. Kaiken tavoitteena on parempia ja helpommin saavutettavia eurooppalaisia data-, aineistonhallinta- ja koulutuspalveluja tutkijoille.

CESSDA on lyhenne sanoista Consortium of European Social Science Data Archives. Lyhyesti sanottuna CESSDA on eurooppalainen tutkimusinfrastruktuuri, joka tarjoaa tutkijoille kansainvälistä aineistopalvelua ja koulutusta. CESSDAn jäseniä ovat valtiot, ja sen keskustoimisto sijaitsee Bergenissä. Varsinaisten tutkijapalveluiden tuottamisen hoitavat jäsenmaiden data-arkistot, Suomessa siis Tietoarkisto.

Nykyisessä konsortiomuodossaan CESSDA on toiminut kesäkuusta 2013, mutta sen historia Euroopan kansallisten tietoarkistojen epävirallisena kattojärjestönä alkaa jo vuodesta 1976. Tällä hetkellä CESSDAssa tapahtuu enemmän kuin koskaan. Viime vuonna alkoi useita hankkeita, jotka tähtäävät keskitettyjen palveluiden rakentamiseen ja CESSDAn laajentumiseen.


Kuvassa CESSDA House Bergenissä.

Suomen Akatemian FIRI-rahoituksen myötä Tietoarkiston palvelut ja osaaminen ovat viimeisten viiden vuoden aikana nousseet kansainväliselle huipputasolle. Haluammekin viedä meillä käytössä olevat hyvät toimintatavat osaksi eurooppalaisia tutkijapalveluita. Tietenkin haluamme vastaavasti myös tuoda parhaat eurooppalaiset data- ja koulutuspalvelut suomalaisen tutkimusyhteisön ulottuville. Tämä onnistuu parhaiten olemalla CESSDAssa proaktiivinen toimija ja vaikuttaja. Ja sellainen Tietoarkisto on.

Esimerkiksi oma työni koostuu seuraavat kaksi vuotta lähes kokonaan CESSDAan liittyvistä tehtävistä. Myös monet muut tietoarkistolaiset osallistuvat aktiivisesti CESSDAn toimintoihin.

CESSDA etenee palvelujen rakentamisessa työsuunnitelmansa mukaan. Työsuunnitelma koostuu tehtävistä, joita kansalliset palveluntuottajat toteuttavat joko yksin tai yhdessä. Toteuttajat valitaan kilpailumenettelyllä: palveluntuottajat lähettävät CESSDAlle hankehakemuksen, joka sisältää sekä suunnitelman että kustannusarvion, ja ulkoisen arvioinnin jälkeen CESSDA valitsee parhaan hanke-esityksen toteutettavaksi.

Tietoarkisto on mukana kolmessa työsuunnitelman mukaisessa hankkeessa, mitä voidaan pitää erinomaisena saavutuksena. Nämä kolme hanketta ovat:

  • CESSDA Metadata Management -hanke, jota Tietoarkisto johtaa. Hankkeessa luodaan yhteinen metatietomalli ja yhteiset metatietokäytännöt CESSDAn palveluntuottajille. Yhteinen metatietoprofiili ja monikieliset kontrolloidut sanastot tukevat yhteisten eurooppalaisten palvelujen, kuten aineistoluettelon ja kysymyspankin rakentamista. Tietoarkiston lisäksi hankkeessa on mukana seitsemän palveluntuottajaa. Hanke päättyy keväällä 2017.
  • CESSDA Metadata Harvesting Tool -hanke, joka kehittää metadatan haravointiratkaisun muun muassa CESSDAn yhteisen aineistoluettelon rakentamista varten. Hanketta vetää Norjan tietoarkisto NSD ja siinä on mukana neljä palveluntuottajaa. Haravointityökalu valmistuu vuoden 2016 aikana.
  • CESSDA Expert Seminar 2015 on Trust -hanke, joka järjesti joulukuussa 2015 CESSDAn asiantuntijaseminaarin Haagissa. Päävastuun seminaarista kantoi hollantilainen DANS, ja Tietoarkisto oli yksi kolmesta muusta järjestäjästä. Seminaarin aiheina olivat luotettava sähköinen pitkäaikaissäilytys ja CESSDAn palveluntuottajille asettamat vaatimukset.

CESSDA on perustanut myös neljä pysyvää työryhmää ohjaamaan toimintaa. Työryhmät koostuvat palveluntuottajien asiantuntijoista. Tietoarkisto on mukana kolmessa työryhmässä: CESSDA Trust Support Group, CESSDA Training Group ja CESSDA Communications Group. Lisäksi Tietoarkisto on aktiivisesti mukana kehittämässä yhteiskuntatieteiden monikielistä tesaurusta ELSSTiä.

Keskitettyjen palveluiden rakentamisen ohella CESSDA laajentaa verkostoaan seuraavien kahden vuoden aikana. Nykyisten 15 jäsenmaan lisäksi konsortioon halutaan mukaan loputkin Euroopan maat. Tätä varten CESSDA haki ja sai rahoitusta Euroopan unionin tutkimuksen ja innovoinnin Horizon 2020 -puiteohjelmasta. CESSDA SaW: Strengthening and widening the European infrastructure for social science data archives -hanke jatkuu elokuuhun 2017 asti. Tietoarkisto on mukana työpaketissa, jonka teemana on tietämyksen jakaminen eri arkistojen välillä, ja jossa keskitytään muun muassa digitaalisen pitkäaikaissäilyttämisen haasteisiin ja malleihin, sertifiointiin ja kustannuksiin. SaW-projektin myötä CESSDA luo Euroopan tutkimusalueen data-arkistoille entistä tiiviimmän ja vuorovaikutteisemman yhteistyöverkon.

Tässä esitellyt tehtävät ja hankkeet ovat vain alkua CESSDA-palvelujen rakentamiselle. Työsuunnitelmassa riittää tehtävää useammalle vuodelle, ja uusia avauksia otetaan mukaan maailman muuttuessa. Toivon ja uskon, että Tietoarkisto osallistuu aktiivisesti CESSDAn kehittämiseen tässä mainittujen hankkeiden päätyttyäkin. On tehokkaampaa olla luomassa yhteisiä käytäntöjä kuin rakentaa omia erillisiä ratkaisuja tai sopeuttaa omia olemassa olevia ja toimivia ratkaisuja toisten vaatimuksiin.

Lisätietoja:
» CESSDAn palvelut Tietoarkiston sivuilla
» CESSDA SaW
» CESSDAn verkkosivut
» Tietoarkiston hankkeet

Mari Kleemola
kehittämispäällikkö, projektit ja kehittäminen -moduulin johtaja
etunimi.sukunimi [at] uta.fi

Tietoarkisto on aktiivinen eurooppalainen osaaja

Tietoarkisto on CESSDAn Suomen kansallinen palveluntuottaja. Tämä lyhyt toteamus pitää sisällään paljon hankkeita ja paljon työtä – sekä runsaasti puhelin- ja videokokouksia, onhan kysymys yhteiseurooppalaisesta toiminnasta. Kaiken tavoitteena on parempia ja helpommin saavutettavia eurooppalaisia data-, aineistonhallinta- ja koulutuspalveluja tutkijoille.

CESSDA on lyhenne sanoista Consortium of European Social Science Data Archives. Lyhyesti sanottuna CESSDA on eurooppalainen tutkimusinfrastruktuuri, joka tarjoaa tutkijoille kansainvälistä aineistopalvelua ja koulutusta. CESSDAn jäseniä ovat valtiot, ja sen keskustoimisto sijaitsee Bergenissä. Varsinaisten tutkijapalveluiden tuottamisen hoitavat jäsenmaiden data-arkistot, Suomessa siis Tietoarkisto.

Nykyisessä konsortiomuodossaan CESSDA on toiminut kesäkuusta 2013, mutta sen historia Euroopan kansallisten tietoarkistojen epävirallisena kattojärjestönä alkaa jo vuodesta 1976. Tällä hetkellä CESSDAssa tapahtuu enemmän kuin koskaan. Viime vuonna alkoi useita hankkeita, jotka tähtäävät keskitettyjen palveluiden rakentamiseen ja CESSDAn laajentumiseen.


Kuvassa CESSDA House Bergenissä.

Suomen Akatemian FIRI-rahoituksen myötä Tietoarkiston palvelut ja osaaminen ovat viimeisten viiden vuoden aikana nousseet kansainväliselle huipputasolle. Haluammekin viedä meillä käytössä olevat hyvät toimintatavat osaksi eurooppalaisia tutkijapalveluita. Tietenkin haluamme vastaavasti myös tuoda parhaat eurooppalaiset data- ja koulutuspalvelut suomalaisen tutkimusyhteisön ulottuville. Tämä onnistuu parhaiten olemalla CESSDAssa proaktiivinen toimija ja vaikuttaja. Ja sellainen Tietoarkisto on.

Esimerkiksi oma työni koostuu seuraavat kaksi vuotta lähes kokonaan CESSDAan liittyvistä tehtävistä. Myös monet muut tietoarkistolaiset osallistuvat aktiivisesti CESSDAn toimintoihin.

CESSDA etenee palvelujen rakentamisessa työsuunnitelmansa mukaan. Työsuunnitelma koostuu tehtävistä, joita kansalliset palveluntuottajat toteuttavat joko yksin tai yhdessä. Toteuttajat valitaan kilpailumenettelyllä: palveluntuottajat lähettävät CESSDAlle hankehakemuksen, joka sisältää sekä suunnitelman että kustannusarvion, ja ulkoisen arvioinnin jälkeen CESSDA valitsee parhaan hanke-esityksen toteutettavaksi.

Tietoarkisto on mukana kolmessa työsuunnitelman mukaisessa hankkeessa, mitä voidaan pitää erinomaisena saavutuksena. Nämä kolme hanketta ovat:

  • CESSDA Metadata Management -hanke, jota Tietoarkisto johtaa. Hankkeessa luodaan yhteinen metatietomalli ja yhteiset metatietokäytännöt CESSDAn palveluntuottajille. Yhteinen metatietoprofiili ja monikieliset kontrolloidut sanastot tukevat yhteisten eurooppalaisten palvelujen, kuten aineistoluettelon ja kysymyspankin rakentamista. Tietoarkiston lisäksi hankkeessa on mukana seitsemän palveluntuottajaa. Hanke päättyy keväällä 2017.
  • CESSDA Metadata Harvesting Tool -hanke, joka kehittää metadatan haravointiratkaisun muun muassa CESSDAn yhteisen aineistoluettelon rakentamista varten. Hanketta vetää Norjan tietoarkisto NSD ja siinä on mukana neljä palveluntuottajaa. Haravointityökalu valmistuu vuoden 2016 aikana.
  • CESSDA Expert Seminar 2015 on Trust -hanke, joka järjesti joulukuussa 2015 CESSDAn asiantuntijaseminaarin Haagissa. Päävastuun seminaarista kantoi hollantilainen DANS, ja Tietoarkisto oli yksi kolmesta muusta järjestäjästä. Seminaarin aiheina olivat luotettava sähköinen pitkäaikaissäilytys ja CESSDAn palveluntuottajille asettamat vaatimukset.

CESSDA on perustanut myös neljä pysyvää työryhmää ohjaamaan toimintaa. Työryhmät koostuvat palveluntuottajien asiantuntijoista. Tietoarkisto on mukana kolmessa työryhmässä: CESSDA Trust Support Group, CESSDA Training Group ja CESSDA Communications Group. Lisäksi Tietoarkisto on aktiivisesti mukana kehittämässä yhteiskuntatieteiden monikielistä tesaurusta ELSSTiä.

Keskitettyjen palveluiden rakentamisen ohella CESSDA laajentaa verkostoaan seuraavien kahden vuoden aikana. Nykyisten 15 jäsenmaan lisäksi konsortioon halutaan mukaan loputkin Euroopan maat. Tätä varten CESSDA haki ja sai rahoitusta Euroopan unionin tutkimuksen ja innovoinnin Horizon 2020 -puiteohjelmasta. CESSDA SaW: Strengthening and widening the European infrastructure for social science data archives -hanke jatkuu elokuuhun 2017 asti. Tietoarkisto on mukana työpaketissa, jonka teemana on tietämyksen jakaminen eri arkistojen välillä, ja jossa keskitytään muun muassa digitaalisen pitkäaikaissäilyttämisen haasteisiin ja malleihin, sertifiointiin ja kustannuksiin. SaW-projektin myötä CESSDA luo Euroopan tutkimusalueen data-arkistoille entistä tiiviimmän ja vuorovaikutteisemman yhteistyöverkon.

Tässä esitellyt tehtävät ja hankkeet ovat vain alkua CESSDA-palvelujen rakentamiselle. Työsuunnitelmassa riittää tehtävää useammalle vuodelle, ja uusia avauksia otetaan mukaan maailman muuttuessa. Toivon ja uskon, että Tietoarkisto osallistuu aktiivisesti CESSDAn kehittämiseen tässä mainittujen hankkeiden päätyttyäkin. On tehokkaampaa olla luomassa yhteisiä käytäntöjä kuin rakentaa omia erillisiä ratkaisuja tai sopeuttaa omia olemassa olevia ja toimivia ratkaisuja toisten vaatimuksiin.

Lisätietoja:
» CESSDAn palvelut Tietoarkiston sivuilla
» CESSDA SaW
» CESSDAn verkkosivut
» Tietoarkiston hankkeet

Mari Kleemola
kehittämispäällikkö, projektit ja kehittäminen -moduulin johtaja
etunimi.sukunimi [at] uta.fi

Tutkimusdatan hallinnan asiantuntijapalvelut edellyttävät koulutuksen vahvistamista

Tietoarkisto järjesti joulukuun 2014 alussa seminaarin erityisesti kirjastoasiantuntijoille. Otsikkona oli Avoin tutkimusdata ja aineistonhallinta ihmistieteissä. Päivän tavoitteita olivat yleiskuva tutkimusrahoittajien ja -organisaatioiden tutkimusdatapolitiikoista Suomessa sekä perehtyminen tutkimusaineistojen hallintaan ja sen valtakunnallisiin tuki-infrastruktuureihin.

Kiinnostusta piisasi ja keskustelua heräsi. Onhan akateemisilla kirjastoilla jo orastava rooli myös datanhallinnan tietopalveluissa. Esimerkiksi Helsingin yliopiston tulevan tutkimusdatapolitiikan toimeenpanosuunnitelmissa yliopistokirjastolle on kaavailtu keskeisiä tehtäviä.

Väkeä tuli seminaariin mukaan hyvin eri yliopistoista ja paikalla oli kuutisenkymmentä asiantuntijaa. Uskoakseni osallistujat myös saivat mitä olivat tulleet hakemaan. Seminaaritallenteisiin ja esitysten dioihin voi tutustua seminaarisivustolla.

Jatkan tässä kirjoituksessa pohdintaa datapalvelualan koulutustarpeista ja -mahdollisuuksista, joista keskusteltiin seminaarin päättäneessä paneelissa. Näkökannoissa korostuivat sekä tutkimusdatapalvelualan täydennyskoulutuksen että alan tutkintokoulutuksen vahvistamistarpeet.

Millaiset ovat tutkimusdatan hallinnan asiantuntijoiden koulutustarpeiden peruslähtökohdat? Alan koulutuksen sisällöt, tarjonnan kohdeyleisöt sekä vastuut ja työnjako ovat sidoksissa etenkin siihen, miten tutkimusdatan hallinta ja keskeiset tietopalvelut järjestetään eri organisaatioissa ja mikä on valtakunnallinen työnjako. Tässä on tilaa useille toimijoille – sekä palvelujen tuottamisessa että osaamista vahvistavassa koulutuksessa. Luultavasti datanhallinnan tukipalvelumallit tulevat kehittymään ajan mittaan ja vaihtelemaan organisaatioittain.

Yksi toimivimmista on malli, jossa valtakunnalliset tukipalvelut (Tietoarkisto, CSC, ja muut valtakunnallisesti keskitetyt toimijat) tarjoavat suurelta osin tutkimusdatan dokumentointi-, arkistointi-, pitkäaikaissäilytys- ja jatkokäyttöpalvelut sekä täsmällistä erityisasiantuntemusta vaativia aineistohallintapalveluja. Jossakin määrin tällaisia palveluja tulevat luultavasti organisoimaan myös suurimmat valtion asiantuntijaorganisaatiot, ainakin itselleen.

Tutkimusympäristöjen muuttuessa tarvitaan paljon muutakin asiantuntemusta. On hyvä, jos tutkija löytää lähitietopalvelut paikan päältä, esimerkiksi juuri kirjastosta tai muista paikallisista tutkimuksen tukipalveluista. Sekä yliopistojen että muiden tutkimusorganisaatioiden informaatiopalveluissa on nyt ja tulevaisuudessa tarvetta tietopalvelualan asiantuntijoille, jotka erikoistuvat tutkimusdatan hallinnan, elinkaaren ja saatavuuden edistämisen tukeen.

Yhdysvalloissa tällaisia ammattilaisia kuvataan esimerkiksi ammattinimikeellä ”data librarian” tai yleiskäsitteellä ”research data professional”. He auttavat tutkijoita paikallistamaan tutkimusongelmiin soveltuvia, olemassa olevia aineistoja sekä osaavat jakaa tietoa tutkimusrahoittajien ja tutkimuksen julkaisijoiden ehdoista ja suosituksista tutkimusdatan avaamisen suhteen. Lisäksi heidän tulee olla luonnollisesti perillä oman tutkimusorganisaation käytännöistä datan hallinnassa tutkimusprojektien aikana ja tutkimusaineistojen avaamisessa hankkeiden päätyttyä. Tämä tehtävä korostuu organisaatiokohtaisten tutkimusdatapolitiikkojen yleistyessä.

Suomessa on akuutti tarve vahvistaa tutkimusdatapalveluihin erikoistuvien asiantuntijoiden koulutusta. Luonteva areena asian pikaiseen edistämiseen olisi yhteistyöfoorumi, jossa toimintaa voitaisiin suunnitella alustavasti ainakin alan valtakunnallisten tukipalvelujen ja kirjastoalan asiantuntijoiden ja heidän järjestöjensä ja verkostojensa voimin. Mukaan olisi hyvä saada myös informaatiotutkimuksen ja arkistoalan koulutuksen asiantuntijoita eri yliopistoista.

Missä tapaamme työpajan merkeissä vuonna 2015?

Lisätietoja:
» Seminaariesitysten diat ja AV-tallenteet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tutkimusdatan hallinnan asiantuntijapalvelut edellyttävät koulutuksen vahvistamista

Tietoarkisto järjesti joulukuun 2014 alussa seminaarin erityisesti kirjastoasiantuntijoille. Otsikkona oli Avoin tutkimusdata ja aineistonhallinta ihmistieteissä. Päivän tavoitteita olivat yleiskuva tutkimusrahoittajien ja -organisaatioiden tutkimusdatapolitiikoista Suomessa sekä perehtyminen tutkimusaineistojen hallintaan ja sen valtakunnallisiin tuki-infrastruktuureihin.

Kiinnostusta piisasi ja keskustelua heräsi. Onhan akateemisilla kirjastoilla jo orastava rooli myös datanhallinnan tietopalveluissa. Esimerkiksi Helsingin yliopiston tulevan tutkimusdatapolitiikan toimeenpanosuunnitelmissa yliopistokirjastolle on kaavailtu keskeisiä tehtäviä.

Väkeä tuli seminaariin mukaan hyvin eri yliopistoista ja paikalla oli kuutisenkymmentä asiantuntijaa. Uskoakseni osallistujat myös saivat mitä olivat tulleet hakemaan. Seminaaritallenteisiin ja esitysten dioihin voi tutustua seminaarisivustolla.

Jatkan tässä kirjoituksessa pohdintaa datapalvelualan koulutustarpeista ja -mahdollisuuksista, joista keskusteltiin seminaarin päättäneessä paneelissa. Näkökannoissa korostuivat sekä tutkimusdatapalvelualan täydennyskoulutuksen että alan tutkintokoulutuksen vahvistamistarpeet.

Millaiset ovat tutkimusdatan hallinnan asiantuntijoiden koulutustarpeiden peruslähtökohdat? Alan koulutuksen sisällöt, tarjonnan kohdeyleisöt sekä vastuut ja työnjako ovat sidoksissa etenkin siihen, miten tutkimusdatan hallinta ja keskeiset tietopalvelut järjestetään eri organisaatioissa ja mikä on valtakunnallinen työnjako. Tässä on tilaa useille toimijoille – sekä palvelujen tuottamisessa että osaamista vahvistavassa koulutuksessa. Luultavasti datanhallinnan tukipalvelumallit tulevat kehittymään ajan mittaan ja vaihtelemaan organisaatioittain.

Yksi toimivimmista on malli, jossa valtakunnalliset tukipalvelut (Tietoarkisto, CSC, ja muut valtakunnallisesti keskitetyt toimijat) tarjoavat suurelta osin tutkimusdatan dokumentointi-, arkistointi-, pitkäaikaissäilytys- ja jatkokäyttöpalvelut sekä täsmällistä erityisasiantuntemusta vaativia aineistohallintapalveluja. Jossakin määrin tällaisia palveluja tulevat luultavasti organisoimaan myös suurimmat valtion asiantuntijaorganisaatiot, ainakin itselleen.

Tutkimusympäristöjen muuttuessa tarvitaan paljon muutakin asiantuntemusta. On hyvä, jos tutkija löytää lähitietopalvelut paikan päältä, esimerkiksi juuri kirjastosta tai muista paikallisista tutkimuksen tukipalveluista. Sekä yliopistojen että muiden tutkimusorganisaatioiden informaatiopalveluissa on nyt ja tulevaisuudessa tarvetta tietopalvelualan asiantuntijoille, jotka erikoistuvat tutkimusdatan hallinnan, elinkaaren ja saatavuuden edistämisen tukeen.

Yhdysvalloissa tällaisia ammattilaisia kuvataan esimerkiksi ammattinimikeellä ”data librarian” tai yleiskäsitteellä ”research data professional”. He auttavat tutkijoita paikallistamaan tutkimusongelmiin soveltuvia, olemassa olevia aineistoja sekä osaavat jakaa tietoa tutkimusrahoittajien ja tutkimuksen julkaisijoiden ehdoista ja suosituksista tutkimusdatan avaamisen suhteen. Lisäksi heidän tulee olla luonnollisesti perillä oman tutkimusorganisaation käytännöistä datan hallinnassa tutkimusprojektien aikana ja tutkimusaineistojen avaamisessa hankkeiden päätyttyä. Tämä tehtävä korostuu organisaatiokohtaisten tutkimusdatapolitiikkojen yleistyessä.

Suomessa on akuutti tarve vahvistaa tutkimusdatapalveluihin erikoistuvien asiantuntijoiden koulutusta. Luonteva areena asian pikaiseen edistämiseen olisi yhteistyöfoorumi, jossa toimintaa voitaisiin suunnitella alustavasti ainakin alan valtakunnallisten tukipalvelujen ja kirjastoalan asiantuntijoiden ja heidän järjestöjensä ja verkostojensa voimin. Mukaan olisi hyvä saada myös informaatiotutkimuksen ja arkistoalan koulutuksen asiantuntijoita eri yliopistoista.

Missä tapaamme työpajan merkeissä vuonna 2015?

Lisätietoja:
» Seminaariesitysten diat ja AV-tallenteet

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

ATT käynnistyi

Opetus- ja kulttuuriministeriö on käynnistänyt tiedon saatavuuden ja avoimen tieteen edistämiseksi Avoimen tieteen ja tutkimuksen hankkeen vuosille 2014–2017. Virallisena tavoitteenaan ATT-hanke ”määrittää kansallisen tahtotilan vuodelle 2017 ja edistää avointa tiedettä kolmella rintamalla: tutkimusjulkaisut, tutkimusdata ja menetelmät”.

Avausseminaari järjestettiin Helsingissä 19.3.2014. Ohjelman pääosan muodostivat kolme paneelia, joissa aiheina olivat hankkeen tavoitteiden mukaan avoimet julkaisut, avoin data ja avoimet menetelmät. Toimin puheenjohtajana tutkimusdatapaneelissa, johon osallistuivat panelisteina Pirjo-Leena Forsström CSC:stä, Laura Höijer Ympäristöhallinnosta, Tuuli Toivonen Helsingin yliopistosta sekä Jussi Simpura THL:stä. Kokoan seuraavassa paneelin antia kahdesta keskusteluteemasta.

Miksi avata tutkimusdataa? Keskustelussa nousi esiin demokratianäkökulma: avaamalla tutkimusdataa kaikki pääsevät käyttämään sitä. Datan avoimen saatavuuden koheneminen voi myös edesauttaa innovaatioita ja luovuutta, mikä edistää tutkimuksen tuottavuutta.

Vaikka datan avaaminen maksaa, se voi tuottaa uutta liiketoimintaa ja tuoda myös säästöjä muun muassa uusien aineistojen pienempinä keruukustannuksina. Suomea koskevan tutkimusdatan avaaminen kansainväliseen käyttöön saattaa myös luoda uudentyyppistä, maatamme hyödyttävää tutkimustoimintaa ulkomaille.

Tutkijoiden näkökulmasta datan avaamista pidettiin erittäin keskeisenä tavoitteena. Useat panelistit mainitsivat tarpeen tieteellisen toimintakulttuurin muutokseen siten, että tutkimusdatan julkaiseminen ymmärrettäisiin tieteellisenä meriittinä. Oman tutkimuksen aineistojen avaaminen on tutkijalle myös uskottavuuskysymys, koska datansa julkaisseen tutkijan tulokset voi aina tarkistaa.

Paneeli käsitteli myös tutkimusdatan avaamisen haasteita Suomessa. Mainittujen asioiden lista muodostui pitkäksi: miten viitata tutkimusdataan ja antaa siitä meriittiä; tekijyys- ja omistajuuskysymykset; datan lisensointi; tietosuojakysymykset ja tutkimusetiikka; julkaisujen, datan ja menetelmien yhdistäminen; tutkimustiedon hyödyntäminen yhteiskunnallisessa päätöksenteossa jne.

Avaamista tukevan toimintakulttuurimuutoksen haasteena on edelleen tutkimusdatan ymmärtäminen tutkijan (omana) pääomana. Liian usein datan jakaminen mielletään siitä luopumisena ja ehkä kilpailuedunkin menettämisenä. Juuri siksi tutkimusrahoittajien ja -organisaatioiden tulisi edellyttää ja ohjeistaa tutkimusdatan hallintaa ja sen suunnittelua riittävästi. Aineistonhallinnan suunnittelu ja toteuttaminen pitäisi saada itsestään selväksi osaksi tutkijoiden perustyönkuvaa.

Lisäksi paneeli totesi, että tietovarantojen avaamisessa on otettava huomioon riittävä jatkokäytön tuki. Monien tutkimusaineistojen järkevä jatkokäyttö vaatii vierihoitoa aineiston keränneeltä taholta. Tutkimusdatan jatkokäyttäjän ei siis pidä lähteä soitellen sotaan. Ei pidä laulaa virttä, jos ei tiedä sen numeroa.

Datapaneeli on nähtävissä kokonaisuudessaan seminaaritallenteesta, joka sisältää kaikki muutkin seminaariesitykset ja paneelit. Seminaari oli hyvä avaus ATT:lle.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi