Tag Archives: avoimuus

Kaksi viestiä

Yliopistojen ulkoinen tiedeviestintä tuntuu muuttuvan etupainotteiseksi elvistelyksi. Liian paljon keskitytään esittelemään aikomuksia ja saadun tutkimusrahoituksen määrää. No – mitä isot edellä, sitä pienet perässä. Tietoarkistokin sai juuri mittavan rahoituksen Suomen Akatemialta toimintojensa vahvistamiseen. Kuinka ollakaan, omakin uutisointimme muisti mainita muhkean rahasumman.

Yksikkömme kaltaiselle tuki-infrastruktuurille ei tarjoudu liian usein mahdollisuuksia kertoa toiminnastaan laajalle yleisölle. Viestintämme on enimmäkseen kansallisen ja kansainvälisen tutkimusyhteisön sisäistä. Sen pääkohteita ovat yliopistot, tutkimusorganisaatiot ja muut tutkimusaineistoja keräävät, teettävät ja käyttävät tahot. Palvelujemme pääkäyttäjäryhmiä ovat tutkijat, opettajat ja opiskelijat.

Ydinviestimme kaikille on palvelujemme maksuton käyttömahdollisuus ja niiden hyödyllisyys tutkimusaineistojen elinkaaren hallinnan ja aktiivisen, avoimen käytön kannalta. Meille voi ja kannattaa arkistoida tutkimusaineistonsa, koska sitä kautta se dokumentoidaan kansainvälisen kuvailukäytännön mukaan. Aineistolle annetaan aineistoviite, tutkimusdata julkaistaan ja siihen voidaan viitata. Julkaistu aineisto on tuottajalleen tieteellinen meriitti. Tutkimuseettisen neuvottelukunnan ja keskeisten tiederahoittajien nykysuosituksen mukaan julkaistujen tutkimusdatojen aineistoviitteet liitetään tutkimuksen harjoittajan ansioluetteloon muiden julkaisujen tavoin.

Tutkimusaineistoihin viittaamista tietoarkisto tukee kääntämällä tarvittaessa aineiston kuvailun englanniksi. Näin aineisto voidaan liittää kansainvälisiin tutkimusaineistotietokantoihin. Kvantitatiivisten tutkimusaineistojen osalta kielenkäännökset kattavat data-aineiston muuttujakuvauksineen.

Tutkimusaineistojen jatkokäyttäjille tarjoamme monipuolisia ja muitakin kuin yhteiskuntatieteitä tukevia palveluja. Aineistosivujen ohella verkkosivujemme keskeisiä sisältöjä ovat Tutkimusaineistojen tiedonhallinnan käsikirja ja Menetelmäopetuksen tietovaranto. Ne ovat laaja-alaisia oppaita tutkimusaineistojen keruuseen ja analyysivaiheen hallintaan sekä tutkimusaineistojen käyttöön. Muistutettakoon, että Suomen Akatemia edellyttää kaikilla tieteenaloilla rahoituksen hakijoilta aineistohallinnan suunnittelua osana tutkimussuunnitelmaa.

Ydinviestin ohella tietoarkistolla on muutosviesti. Piakkoin ilmestyvä, painetun Tietoarkisto-lehden uusi numero valottaa tietoarkistojen eurooppalaisen yhteistyön syvenemistä. Lisäksi se esittelee muita yhteiskuntatieteiden ja humanististen tieteenalojen eurooppalaisia tutkimusinfrastruktuureja, joiden kehittäminen on kuulunut jo tovin tutkimuksen kehittämisen painoaloihin EU:ssa. Kiitos jälleen kerran Helena Laaksoselle lehden kokoamisesta.

Valmistautuminen eurooppalaiseen CESSDA-yhteistyöhön on tarjonnut tietoarkistolle väylän myös kansallisten palvelujen laajentamiseen ja vahvistamiseen. Tämä alkaa näkyä erityisesti vuodesta 2014 alkaen, kun jo käynnissä olleet, Suomen Akatemian rahoittamat kehittämishankkeet tuottavat näkyviä muutoksia palveluihimme.

Ensi vuoden alussa tietoarkiston tallentamien aineistojen tilaus- ja toimitusjärjestelmä muuttuu sähköiseksi, jolloin rekisteröityneet käyttäjät saavat data-aineistot käyttöönsä suoraan verkosta. Yliopisto- ja ammattikorkeakoulukäyttäjät voivat käyttää aineistopalvelujamme oppilaitoksensa käyttäjätunnuksella. Aineistojen tilaus- ja toimitusjärjestelmän uudistus on ollut erittäin mittava työkokonaisuus, josta ovat vastanneet osana Tietoarkisto 2015 -hanketta yksikön kaksi toiminnallista osastoa, aineistopalvelut ja tekniset palvelut. Vastuullisille kuuluu iso kiitos urakasta.

Peruspalvelumme ovat avoimesti ja maksutta käytössänne. Tämä on edelleen ydinviestimme. Muutosviestimme on palveluiltaan vahvistuva ja laajeneva tietoarkisto.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Uusi CESSDA palvelee tutkijoita

Useimmissa Euroopan maissa toimii kansallinen yhteiskuntatieteellinen data-arkisto. Näiden yhteistyössä saavutettiin juhannusviikolla merkittävä virstanpylväs, kun Bergenissä järjestettiin alan uuden eurooppalaisen tutkimusinfrastruktuurin aloittamiskokous. Yleiskokoukseen osallistui 15 eri maasta yli kaksikymmentä asiantuntijaa, jotka edustivat maidensa tutkimuksesta vastaavia ministeriöitä ja muita keskeisiä tutkimusrahoittajia.

Uuden CESSDA-infrastruktuurin palvelut perustuvat paljolti kansallisten palveluntuottajien toimintaan, jossa alan yhteistyö alkoi jo 1970-luvun puolivälissä. Vanhasta CESSDAsta (Council of European Social Science Data Archives) säilyy uuden CESSDAn nimeen lyhenne, mutta yhteistyö muuttuu täysin sekä hallinnollisesti että toimintamalliltaan.

Uusi konsortiomuotoinen yhteistyö tulee rakentumaan eurooppalaisille tutkimusinfrastruktuureille räätälöityyn ERIC-muotoon. Tutkimusinfrastruktuurin jäseniksi liittyvät jäsenvaltiot, eivät itse palveluyksiköt. Kussakin osallistujamaassa jäsenvaltio valitsee palveluntuottajansa ja Suomessa tehtävää hoitaa tietoarkisto. Uuden CESSDAn päärahoittajia ovat Norja ja Saksa, joihin sijoitetaan infrastruktuurin keskuspalvelut. CESSDAn ”pääkonttori” aloittaa toimintansa Bergenissä kuluvan vuoden syksyllä. Keskustoimintojen vuosibudjetti on 1,9 miljoonaa euroa.

Tietoarkistolle uusi yhteistyö tuo mukanaan uusia palveluvelvoitteita, jota varten FSD:ssä on käynnissä useita kehittämishankkeita. Tietoarkiston tavoitteena on luoda lähivuosina sellainen palveluvalmius, osaamistaso ja tekninen infrastruktuuri, että ne mahdollistavat Suomen palvelujen saumattoman integroinnin uuteen eurooppalaiseen järjestelmään. Suomen tietoarkiston tavoitteena on mahdollisimman aktiivinen osallistuminen uuden CESSDAn kehittämiseen.

Kansalliset tietoarkistot ja niiden toimintaa koordinoiva uusi CESSDA palvelevat tutkimusta ja opetusta. Tavoitteena on palvelumalli, jossa tutkijat rekisteröidään ja valtuutetaan CESSDAn palvelujen käyttäjiksi välttäen päällekkäisiä teknisiä ratkaisuja. Järjestelmien valmistuttua esimerkiksi suomalaisen yliopistotutkijan tunnistautuminen ja käyttövaltuuksien myöntäminen CESSDAn verkkopalveluihin perustuu hänen peruspalvelutunnukseensa.

CESSDAn aineistovaranto on jo nyt laaja ja se kasvaa vielä merkittävästi. Tutkimusaineistoja kootaan temaattisiksi kokonaisuuksiksi paljon nykyistä kattavammin, useammilta aloilta ja useammista maista. Datan harmonisointiin ja muuhun käytön helpottamiseen suunnataan uusia resursseja. Näin tutkijat voivat hakea, löytää ja saada käyttöönsä selvästi nykyistä osuvammin ja tehokkaammin tutkimuskysymyksiinsä soveltuvia aineistoja.

Kaikkiaan uusi CESSDA tukee hyvin laaja-alaisesti tutkimuksen ja tutkimusdatan avoimuutta ja avointa käyttöä sekä mahdollisimman korkeatasoisen yhteiskuntatieteellisen tutkimuksen edellytyksiä.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Uusi CESSDA palvelee tutkijoita

Useimmissa Euroopan maissa toimii kansallinen yhteiskuntatieteellinen data-arkisto. Näiden yhteistyössä saavutettiin juhannusviikolla merkittävä virstanpylväs, kun Bergenissä järjestettiin alan uuden eurooppalaisen tutkimusinfrastruktuurin aloittamiskokous. Yleiskokoukseen osallistui 15 eri maasta yli kaksikymmentä asiantuntijaa, jotka edustivat maidensa tutkimuksesta vastaavia ministeriöitä ja muita keskeisiä tutkimusrahoittajia.

Uuden CESSDA-infrastruktuurin palvelut perustuvat paljolti kansallisten palveluntuottajien toimintaan, jossa alan yhteistyö alkoi jo 1970-luvun puolivälissä. Vanhasta CESSDAsta (Council of European Social Science Data Archives) säilyy uuden CESSDAn nimeen lyhenne, mutta yhteistyö muuttuu täysin sekä hallinnollisesti että toimintamalliltaan.

Uusi konsortiomuotoinen yhteistyö tulee rakentumaan eurooppalaisille tutkimusinfrastruktuureille räätälöityyn ERIC-muotoon. Tutkimusinfrastruktuurin jäseniksi liittyvät jäsenvaltiot, eivät itse palveluyksiköt. Kussakin osallistujamaassa jäsenvaltio valitsee palveluntuottajansa ja Suomessa tehtävää hoitaa tietoarkisto. Uuden CESSDAn päärahoittajia ovat Norja ja Saksa, joihin sijoitetaan infrastruktuurin keskuspalvelut. CESSDAn ”pääkonttori” aloittaa toimintansa Bergenissä kuluvan vuoden syksyllä. Keskustoimintojen vuosibudjetti on 1,9 miljoonaa euroa.

Tietoarkistolle uusi yhteistyö tuo mukanaan uusia palveluvelvoitteita, jota varten FSD:ssä on käynnissä useita kehittämishankkeita. Tietoarkiston tavoitteena on luoda lähivuosina sellainen palveluvalmius, osaamistaso ja tekninen infrastruktuuri, että ne mahdollistavat Suomen palvelujen saumattoman integroinnin uuteen eurooppalaiseen järjestelmään. Suomen tietoarkiston tavoitteena on mahdollisimman aktiivinen osallistuminen uuden CESSDAn kehittämiseen.

Kansalliset tietoarkistot ja niiden toimintaa koordinoiva uusi CESSDA palvelevat tutkimusta ja opetusta. Tavoitteena on palvelumalli, jossa tutkijat rekisteröidään ja valtuutetaan CESSDAn palvelujen käyttäjiksi välttäen päällekkäisiä teknisiä ratkaisuja. Järjestelmien valmistuttua esimerkiksi suomalaisen yliopistotutkijan tunnistautuminen ja käyttövaltuuksien myöntäminen CESSDAn verkkopalveluihin perustuu hänen peruspalvelutunnukseensa.

CESSDAn aineistovaranto on jo nyt laaja ja se kasvaa vielä merkittävästi. Tutkimusaineistoja kootaan temaattisiksi kokonaisuuksiksi paljon nykyistä kattavammin, useammilta aloilta ja useammista maista. Datan harmonisointiin ja muuhun käytön helpottamiseen suunnataan uusia resursseja. Näin tutkijat voivat hakea, löytää ja saada käyttöönsä selvästi nykyistä osuvammin ja tehokkaammin tutkimuskysymyksiinsä soveltuvia aineistoja.

Kaikkiaan uusi CESSDA tukee hyvin laaja-alaisesti tutkimuksen ja tutkimusdatan avoimuutta ja avointa käyttöä sekä mahdollisimman korkeatasoisen yhteiskuntatieteellisen tutkimuksen edellytyksiä.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Orvot aineistot

Tietoarkisto on uusinut arkistointia koskevan sopimuksen ja aineistojen jatkokäyttöä koskevat käyttöehdot. Arkistointisopimuksessa halusimme erityisesti täsmentää tilanteita, joissa alkuperäinen tutkija edellyttää häneltä luvan kysymistä jokaiseen aineiston jatkokäyttöön.

Testasimme uuden sopimuksen ehtoja jo viime syksynä muutamien tutkijoiden kanssa. Osa hämmentyi pyynnöstä nimetä vaihtoehtoinen toimintatapa tai toinen henkilö, jolta lupaa aineiston käyttöön voi kysyä, jos aineiston arkistoitunutta henkilöä itseään ei tavoiteta. ”Ei kukaan muu voi antaa käyttöön lupaa, ei vain voi”, sanoi yksi tutkija. Lyhyen hiljaisuuden jälkeen hän itse totesi kuolevansa tietysti joskus.

Tutkijat ja tietoarkiston henkilökunta siirtyvät aikanaan eläkkeelle ja kuolevat. Toisinaan elämän kulkua muuttaa sairaus tai tapaturma. Tietoarkistoon arkistoitu aineisto sen sijaan jatkaa elämäänsä, sillä henkilökunnasta poistuvien tilalle palkataan uutta väkeä. He jatkavat työtä, jolla aineistojen säilyvyys ja käytettävyys varmistetaan tietotekniikan muuttuessa. Tietoarkistokielellä kyse on aineistojen hoivaamisesta (curation).

Uudessa arkistointisopimuksessa tarjoamme mahdollisuuden asettaa jatkokäyttö luvanvaraiseksi vain määräajaksi. Tämä on erityisen hyvä ratkaisu tutkijoille, jotka haluavat ensin varmistua siitä, että tietoarkistossa osataan heidän aineistoansa hoivata. Tutkija voi suhtautua aineistoonsa kuin lapseen ja silloin on ymmärrettävää, että hän haluaa vakuuttua tietoarkiston käytännöistä ennen kuin antaa oikeuden toimittaa aineistoa käytettäväksi myös ilman hänen lupaansa.

Jos luvan kysymiselle ei ole olemassa vaihtoehtoista toimintatapaa, tulee aineistosta orpo, kun luvanantajaa ei enää tavoiteta. Aineistoa ei voi toimittaa jatkokäyttöön ja tietoarkiston toimintaperiaate on arkistoida aineistoja nimenomaan jatkokäyttöä varten. Orvoiksi muuttuvien aineistojen kohtalo täytyy punnita jokaisen aineiston kohdalla erikseen ja joskus päätös on se, että aineistoa ei enää hoivata. Se tarkoittaa sitä, että aineisto muuttuu ennen pitkää myös teknisesti käyttökelvottomaksi.

Vaikka me ihmiset elämme vain hetken, tietoarkisto varmistaa tutkimusaineistoille päättymättömän elinkaaren. Tänään ajankohtaiset aineistot soveltuvat kohta ajalliseen vertailuun ja aikanaan historian tutkimukseen. Pidetään siis aineistot elossa ja käyttökelpoisina ja varmistetaan, ettei niistä tule orpoja.

Katso myös usein kysytyt kysymykset arkistoinnista.

Arja Kuula
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Orvot aineistot

Tietoarkisto on uusinut arkistointia koskevan sopimuksen ja aineistojen jatkokäyttöä koskevat käyttöehdot. Arkistointisopimuksessa halusimme erityisesti täsmentää tilanteita, joissa alkuperäinen tutkija edellyttää häneltä luvan kysymistä jokaiseen aineiston jatkokäyttöön.

Testasimme uuden sopimuksen ehtoja jo viime syksynä muutamien tutkijoiden kanssa. Osa hämmentyi pyynnöstä nimetä vaihtoehtoinen toimintatapa tai toinen henkilö, jolta lupaa aineiston käyttöön voi kysyä, jos aineiston arkistoitunutta henkilöä itseään ei tavoiteta. ”Ei kukaan muu voi antaa käyttöön lupaa, ei vain voi”, sanoi yksi tutkija. Lyhyen hiljaisuuden jälkeen hän itse totesi kuolevansa tietysti joskus.

Tutkijat ja tietoarkiston henkilökunta siirtyvät aikanaan eläkkeelle ja kuolevat. Toisinaan elämän kulkua muuttaa sairaus tai tapaturma. Tietoarkistoon arkistoitu aineisto sen sijaan jatkaa elämäänsä, sillä henkilökunnasta poistuvien tilalle palkataan uutta väkeä. He jatkavat työtä, jolla aineistojen säilyvyys ja käytettävyys varmistetaan tietotekniikan muuttuessa. Tietoarkistokielellä kyse on aineistojen hoivaamisesta (curation).

Uudessa arkistointisopimuksessa tarjoamme mahdollisuuden asettaa jatkokäyttö luvanvaraiseksi vain määräajaksi. Tämä on erityisen hyvä ratkaisu tutkijoille, jotka haluavat ensin varmistua siitä, että tietoarkistossa osataan heidän aineistoansa hoivata. Tutkija voi suhtautua aineistoonsa kuin lapseen ja silloin on ymmärrettävää, että hän haluaa vakuuttua tietoarkiston käytännöistä ennen kuin antaa oikeuden toimittaa aineistoa käytettäväksi myös ilman hänen lupaansa.

Jos luvan kysymiselle ei ole olemassa vaihtoehtoista toimintatapaa, tulee aineistosta orpo, kun luvanantajaa ei enää tavoiteta. Aineistoa ei voi toimittaa jatkokäyttöön ja tietoarkiston toimintaperiaate on arkistoida aineistoja nimenomaan jatkokäyttöä varten. Orvoiksi muuttuvien aineistojen kohtalo täytyy punnita jokaisen aineiston kohdalla erikseen ja joskus päätös on se, että aineistoa ei enää hoivata. Se tarkoittaa sitä, että aineisto muuttuu ennen pitkää myös teknisesti käyttökelvottomaksi.

Vaikka me ihmiset elämme vain hetken, tietoarkisto varmistaa tutkimusaineistoille päättymättömän elinkaaren. Tänään ajankohtaiset aineistot soveltuvat kohta ajalliseen vertailuun ja aikanaan historian tutkimukseen. Pidetään siis aineistot elossa ja käyttökelpoisina ja varmistetaan, ettei niistä tule orpoja.

Katso myös usein kysytyt kysymykset arkistoinnista.

Arja Kuula
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Tekninen kehitys laajentaa tietoarkistojen toimintaa

Ensimmäiset yhteiskuntatieteelliset data-arkistot aloittivat toimintansa 1960-luvulla Yhdysvalloissa ja Euroopassa. Niiden syntyyn vaikutti keskeisesti tietokoneiden ja laajoihin surveyaineistoihin perustuvien tutkimusmenetelmien kehittyminen sekä näiden suosion nopea kasvu useilla ihmistieteellisillä aloilla. Data-arkistoja ryhdyttiin perustamaan myös kaupallisten mielipidetutkimuslaitosten yhteyteen erityisesti Yhdysvalloissa.

Data-arkistot toimivat kolme ensimmäistä vuosikymmentään ja osin vielä 1990-luvullakin keskustietokoneympäristöissä. Varsinkin tästä syystä niiden säilyttämien henkilötason tutkimusaineistojen käyttäjät olivat lähes yksinomaan tutkijoita. Sähköiset datatiedostot haettiin joko paikan päältä arkistoista tai ne kuljetettiin eri tallennevälineillä käyttäjilleen.

Kun itse tilasin 90-luvun alkupuolella Saksan yhteiskuntatieteellisestä data-arkistosta Kölnistä Eurobarometrien data-aineistoja, ne toimitettiin työhuoneeseeni Tampereelle postitse kelanauhoina. Sitten marssin tavaran kanssa yliopistomme tietokonekeskukseen, jossa tiedostot siirrettiin (maksutta) keskuskoneen käyttäjätunnukselleni. Tämän jälkeen vuorossa olivat ascii-muotoisten tiedostojen määrittelyt sellaiseen muotoon, että tilastollinen tietojenkäsittelyohjelma sai datasta tolkkua. Keskuskone oli sen verran ruuhkainen, että suurimmat tietokoneajot piti suosiolla ajoittaa suoritettavaksi illemmalla eikä työpäivän aikana.

Toisin on tänään. Vaikka en edes kuulu varhaiseen reikäkortti- ja lajittelijasukupolveen enkä ole siis värjötellyt tietojenkäsittelyn Siperiassa, olen silti todistanut mikrotietokoneiden ja Internetin vallankumouksen koko tähänastisen polun. Data-arkistoalalle teknologian nopea kehitys on tuonut useita muutoksia ja isoja haasteita. Aikaisemmin ala keskittyi data-aineistojen arkistointiin, pitkäaikaissäilytykseen ja jakeluun erityisesti tutkimuskäyttöä ajatellen. Kansainvälisessä yhteistyössä arkistot toimivat data-aineistojen välittäjinä tutkijoille siten, että kansalliset data-arkistot toimivat oman maansa tutkijoille ulkomaisten aineistojen välittäjinä.

Internet-sukupolvelle ajatus välikäsistä ja pitkistä toimitusajoista on vieras. Yhä useamman tutkijankin mielestä tutkimuksen tietoaineistojen tulisi olla ladattavissa suoraan omalle tietokoneelle luotettavista lähteistä heti ja lähtökohtaisesti myös maksutta. Lisäksi tietojen pitäisi olla vaivattomasti yhdisteltävissä muihin tietoihin ja niiden tulisi muutoinkin olla helppokäyttöisiä. Hyvä näin, sillä todellinen edistys edellyttää aina sitä, että joku vaatii muutosta. Näihin haasteisiin vastaaminen edellyttää toimivia palveluinfrastruktuureja.

Data-arkistoalalla teknologian kehitys on jo avartanut suunnattomasti tutkimusaineistojen käyttötapoja ja -mahdollisuuksia. Avoimet datatietokannat ovat lisänneet huomattavasti soveltuvien tutkimusaineistojen löytymistä ja saatavuutta. Joskus suunniteltu uusi tutkimusaineisto on jäänyt kokonaan keräämättä. Omassa toiminnassamme meitä on ilahduttanut erityisesti se, että perustutkinto-opiskelijat käyttävät tietoarkistoon arkistoituja aineistoja kasvavassa määrin omiin opinnäytetöihinsä.

Myös tietoaineistojen opetuskäytön erilaisia mahdollisuuksia tulisi oppia hyödyntämään täysipainoisesti. Data-projektori ja Internet opetustilassa mahdollistavat jo nyt eri aiheisiin liittyvien dataperustaisten online-palvelujen käytön kontaktiopetuksessa. Näin opetus perustuu ajantasaisimpaan tietoon.

Tietoarkisto on laajentamassa palvelujaan tähän suuntaan. Jo nyt muun muassa Menetelmäopetuksen tietovarannon harjoitusaineistot ovat vapaasti heti käytettävissä. Tavoitteena on myös uusia aineistojen toimitusjärjestelmä vuoden 2012 loppuun mennessä. Uudistuksen valmistuttua rekisteröityneet asiakkaat voivat hyödyntää tietoarkiston koko aineistovarantoa datatiedostoineen suoraan verkossa.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tekninen kehitys laajentaa tietoarkistojen toimintaa

Ensimmäiset yhteiskuntatieteelliset data-arkistot aloittivat toimintansa 1960-luvulla Yhdysvalloissa ja Euroopassa. Niiden syntyyn vaikutti keskeisesti tietokoneiden ja laajoihin surveyaineistoihin perustuvien tutkimusmenetelmien kehittyminen sekä näiden suosion nopea kasvu useilla ihmistieteellisillä aloilla. Data-arkistoja ryhdyttiin perustamaan myös kaupallisten mielipidetutkimuslaitosten yhteyteen erityisesti Yhdysvalloissa.

Data-arkistot toimivat kolme ensimmäistä vuosikymmentään ja osin vielä 1990-luvullakin keskustietokoneympäristöissä. Varsinkin tästä syystä niiden säilyttämien henkilötason tutkimusaineistojen käyttäjät olivat lähes yksinomaan tutkijoita. Sähköiset datatiedostot haettiin joko paikan päältä arkistoista tai ne kuljetettiin eri tallennevälineillä käyttäjilleen.

Kun itse tilasin 90-luvun alkupuolella Saksan yhteiskuntatieteellisestä data-arkistosta Kölnistä Eurobarometrien data-aineistoja, ne toimitettiin työhuoneeseeni Tampereelle postitse kelanauhoina. Sitten marssin tavaran kanssa yliopistomme tietokonekeskukseen, jossa tiedostot siirrettiin (maksutta) keskuskoneen käyttäjätunnukselleni. Tämän jälkeen vuorossa olivat ascii-muotoisten tiedostojen määrittelyt sellaiseen muotoon, että tilastollinen tietojenkäsittelyohjelma sai datasta tolkkua. Keskuskone oli sen verran ruuhkainen, että suurimmat tietokoneajot piti suosiolla ajoittaa suoritettavaksi illemmalla eikä työpäivän aikana.

Toisin on tänään. Vaikka en edes kuulu varhaiseen reikäkortti- ja lajittelijasukupolveen enkä ole siis värjötellyt tietojenkäsittelyn Siperiassa, olen silti todistanut mikrotietokoneiden ja Internetin vallankumouksen koko tähänastisen polun. Data-arkistoalalle teknologian nopea kehitys on tuonut useita muutoksia ja isoja haasteita. Aikaisemmin ala keskittyi data-aineistojen arkistointiin, pitkäaikaissäilytykseen ja jakeluun erityisesti tutkimuskäyttöä ajatellen. Kansainvälisessä yhteistyössä arkistot toimivat data-aineistojen välittäjinä tutkijoille siten, että kansalliset data-arkistot toimivat oman maansa tutkijoille ulkomaisten aineistojen välittäjinä.

Internet-sukupolvelle ajatus välikäsistä ja pitkistä toimitusajoista on vieras. Yhä useamman tutkijankin mielestä tutkimuksen tietoaineistojen tulisi olla ladattavissa suoraan omalle tietokoneelle luotettavista lähteistä heti ja lähtökohtaisesti myös maksutta. Lisäksi tietojen pitäisi olla vaivattomasti yhdisteltävissä muihin tietoihin ja niiden tulisi muutoinkin olla helppokäyttöisiä. Hyvä näin, sillä todellinen edistys edellyttää aina sitä, että joku vaatii muutosta. Näihin haasteisiin vastaaminen edellyttää toimivia palveluinfrastruktuureja.

Data-arkistoalalla teknologian kehitys on jo avartanut suunnattomasti tutkimusaineistojen käyttötapoja ja -mahdollisuuksia. Avoimet datatietokannat ovat lisänneet huomattavasti soveltuvien tutkimusaineistojen löytymistä ja saatavuutta. Joskus suunniteltu uusi tutkimusaineisto on jäänyt kokonaan keräämättä. Omassa toiminnassamme meitä on ilahduttanut erityisesti se, että perustutkinto-opiskelijat käyttävät tietoarkistoon arkistoituja aineistoja kasvavassa määrin omiin opinnäytetöihinsä.

Myös tietoaineistojen opetuskäytön erilaisia mahdollisuuksia tulisi oppia hyödyntämään täysipainoisesti. Data-projektori ja Internet opetustilassa mahdollistavat jo nyt eri aiheisiin liittyvien dataperustaisten online-palvelujen käytön kontaktiopetuksessa. Näin opetus perustuu ajantasaisimpaan tietoon.

Tietoarkisto on laajentamassa palvelujaan tähän suuntaan. Jo nyt muun muassa Menetelmäopetuksen tietovarannon harjoitusaineistot ovat vapaasti heti käytettävissä. Tavoitteena on myös uusia aineistojen toimitusjärjestelmä vuoden 2012 loppuun mennessä. Uudistuksen valmistuttua rekisteröityneet asiakkaat voivat hyödyntää tietoarkiston koko aineistovarantoa datatiedostoineen suoraan verkossa.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tutkimusdata meriittinä

Opetus- ja kulttuuriministeriö julkisti pari viikkoa sitten tiekarttaraportin tutkimuksen sähköisten tietoaineistojen hyödyntämisestä. Siihen on koottu poikkihallinnollisen selvityshankkeen keskeiset ehdotukset alan hyvistä käytännöistä ja tietoaineistojen avoimuutta edistävistä toimenpiteistä. Aiemmin hanke oli tuottanut samaa aihepiiriä käsittelevän taustaraportin, joka luovutettiin opetusministerille vuosi sitten.

Tiekartta on laaja-alainen ja se tarjoaa hyviä polkuja ja myös konkreettisia toimenpide-ehdotuksia tutkimusdatan avoimelle saatavuudelle. Työ edellyttää laaja-alaista yhteistyötä aineistojen tuottajien ja välittäjien kesken sekä lisärahoitusta infrastruktuurien rakentamiseksi. Yksi perusongelma on. Tutkimusdatan pitkäaikaissäilytystä ja käytön avoimuutta tukevat rakenteet, välineet ja käytännöt puuttuvat edelleen lähes tyystin useilta tutkimusaloilta.

Rakenteet ovat pysyväksi tarkoitettuja organisaatioita tai järjestelyjä, joiden erityisvastuulla on tutkimusdatan elinkaaresta huolehtiminen. Välineet ovat esimerkiksi kuvailustandardeja, tietokantoja ja muita datan käytön tietoteknisiä sovelluksia, joiden avulla tutkijat löytävät ja saavat käyttöönsä haluamansa tutkimusaineistot. Käytännöt ovat puolestaan tutkimusyhteisön omaksumia toimintatapoja ja sääntöjä, tutkimuskulttuuria, joka koskee tutkimusaineistojen tekijyyttä ja avoimeen käyttöön saattamista.

Tiekartta nostaa aivan oikein yhdeksi keskeiseksi kansallisen datapolitiikan haasteeksi tutkimusaineistoihin liittyvät tieteelliset meriitit. Tältä osin tiekartta muun muassa toteaa (s. 29), että ”tutkijoiden meritoituminen tietoaineistojen tuottamisesta ja jakamisesta tulee ohjeistaa yhtenäisesti”. Vastuu olisi etenkin tutkimusrahoittajilla, kuten Suomen Akatemialla ja Tekesillä.

Olen itse meritoitumisen yleisestä merkityksestä samaa mieltä, mutta ohjeistamalla asia tuskin ratkeaa. Vastuu käytäntöjen muuttumisesta on myös tutkimusyhteisöllä ja laajasti kaikilla tutkimusta rahoittavilla tahoilla, kuten tutkimusinfrastruktuurirahoituksesta päävastuullisilla ministeriöillä. Tutkimusaineistoihin liittyvä meritoituminen on erinomainen esimerkki osoittamaan alan nykyisiä pullonkauloja.

Kyllä – tutkimusdatan tuottajien pitäisi saattaa datansa tutkimusyhteisön avoimeen käyttöön viimeistään hankkeittensa päätyttyä. Tämä ei välttämättä onnistu sormea napsauttamalla, vaikka tahtoa riittäisikin. Aineiston koonneen ryhmän tulee ensin kyetä sopimaan, kenen nimet ja missä järjestyksessä julkaistavaan aineistoon merkitään tekijöiksi ja kuka tai ketkä vastaavat aineiston jatkokäyttökuntoon saattamisesta.

Datan asianmukainen julkaiseminen puolestaan edellyttää datan kuvailun ja viittaustietojen vaatimia standardeja, jollaisia on valmiina vain harvoilla aloilla. Lisäksi datan julkaiseminen edellyttää sekä aineiston että sen keränneen hankkeen perustietojen kuvailua ja aina jonkin verran myös tutkimusaineiston muokkausta. Tämä vaatii aikaa ja työtä, joka ei läheskään kaikilla aloilla ole siirrettävissä olemassa olevan data-arkiston kontolle.

Lisäksi sekä tutkimusaineiston pitkäaikaissäilytys että sen jatkokäyttö muodostavat omat kokonaisuutensa meriitin muodostumisessa. Julkaistut datat saavat hyvää lisänäkyvyyttä avoimissa aineistotietokannoissa. Esimerkiksi Yhteiskuntatieteellinen tietoarkisto kääntää suomenkielisten aineistojen kuvailut englanniksi ja sijoittaa ne sitten avoimiin, kansainvälisiin datatietokantoihin. Näin ulkomaiset tutkijat pääsevät käyttämään suomalaisia tutkimusaineistoja, joista heillä ei muutoin olisi tietoa.

Luovuttaessaan arkistoituja data-aineistoja jatkokäyttöön tietoarkisto antaa niille viittaustiedon ja -ohjeet, joita jatkokäyttäjän tulee noudattaa. Tätä kautta aineistot ja niiden tekijät tulevat viitatuiksi tavanomaisin tieteellisin referenssein. Runsaassa jatkokäytössä olevat tutkimusaineistot ovat merkittävä meriitti alkuperäisille kokoajille, koska silloin toisten kokoama data on laajasti hyödyllistä tiedeyhteisölle.

Asianmukaisin standardein kuvailtu ja julkaistu tutkimusaineisto on tekijöilleen tieteellinen meriitti, jonka voi ilmoittaa ansioluettelossa. Tiedeyhteisön yhteiseen ja avoimeen käyttöön avatut datat mahdollistavat tieteen itsensäkorjaavuutta ja lisäävät sen yleistä luotettavuutta. Siksi nyt valmistuneen tiekartan toimenpide-ehdotukset pitää ottaa vakavasti.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tutkimusdata meriittinä

Opetus- ja kulttuuriministeriö julkisti pari viikkoa sitten tiekarttaraportin tutkimuksen sähköisten tietoaineistojen hyödyntämisestä. Siihen on koottu poikkihallinnollisen selvityshankkeen keskeiset ehdotukset alan hyvistä käytännöistä ja tietoaineistojen avoimuutta edistävistä toimenpiteistä. Aiemmin hanke oli tuottanut samaa aihepiiriä käsittelevän taustaraportin, joka luovutettiin opetusministerille vuosi sitten.

Tiekartta on laaja-alainen ja se tarjoaa hyviä polkuja ja myös konkreettisia toimenpide-ehdotuksia tutkimusdatan avoimelle saatavuudelle. Työ edellyttää laaja-alaista yhteistyötä aineistojen tuottajien ja välittäjien kesken sekä lisärahoitusta infrastruktuurien rakentamiseksi. Yksi perusongelma on. Tutkimusdatan pitkäaikaissäilytystä ja käytön avoimuutta tukevat rakenteet, välineet ja käytännöt puuttuvat edelleen lähes tyystin useilta tutkimusaloilta.

Rakenteet ovat pysyväksi tarkoitettuja organisaatioita tai järjestelyjä, joiden erityisvastuulla on tutkimusdatan elinkaaresta huolehtiminen. Välineet ovat esimerkiksi kuvailustandardeja, tietokantoja ja muita datan käytön tietoteknisiä sovelluksia, joiden avulla tutkijat löytävät ja saavat käyttöönsä haluamansa tutkimusaineistot. Käytännöt ovat puolestaan tutkimusyhteisön omaksumia toimintatapoja ja sääntöjä, tutkimuskulttuuria, joka koskee tutkimusaineistojen tekijyyttä ja avoimeen käyttöön saattamista.

Tiekartta nostaa aivan oikein yhdeksi keskeiseksi kansallisen datapolitiikan haasteeksi tutkimusaineistoihin liittyvät tieteelliset meriitit. Tältä osin tiekartta muun muassa toteaa (s. 29), että ”tutkijoiden meritoituminen tietoaineistojen tuottamisesta ja jakamisesta tulee ohjeistaa yhtenäisesti”. Vastuu olisi etenkin tutkimusrahoittajilla, kuten Suomen Akatemialla ja Tekesillä.

Olen itse meritoitumisen yleisestä merkityksestä samaa mieltä, mutta ohjeistamalla asia tuskin ratkeaa. Vastuu käytäntöjen muuttumisesta on myös tutkimusyhteisöllä ja laajasti kaikilla tutkimusta rahoittavilla tahoilla, kuten tutkimusinfrastruktuurirahoituksesta päävastuullisilla ministeriöillä. Tutkimusaineistoihin liittyvä meritoituminen on erinomainen esimerkki osoittamaan alan nykyisiä pullonkauloja.

Kyllä – tutkimusdatan tuottajien pitäisi saattaa datansa tutkimusyhteisön avoimeen käyttöön viimeistään hankkeittensa päätyttyä. Tämä ei välttämättä onnistu sormea napsauttamalla, vaikka tahtoa riittäisikin. Aineiston koonneen ryhmän tulee ensin kyetä sopimaan, kenen nimet ja missä järjestyksessä julkaistavaan aineistoon merkitään tekijöiksi ja kuka tai ketkä vastaavat aineiston jatkokäyttökuntoon saattamisesta.

Datan asianmukainen julkaiseminen puolestaan edellyttää datan kuvailun ja viittaustietojen vaatimia standardeja, jollaisia on valmiina vain harvoilla aloilla. Lisäksi datan julkaiseminen edellyttää sekä aineiston että sen keränneen hankkeen perustietojen kuvailua ja aina jonkin verran myös tutkimusaineiston muokkausta. Tämä vaatii aikaa ja työtä, joka ei läheskään kaikilla aloilla ole siirrettävissä olemassa olevan data-arkiston kontolle.

Lisäksi sekä tutkimusaineiston pitkäaikaissäilytys että sen jatkokäyttö muodostavat omat kokonaisuutensa meriitin muodostumisessa. Julkaistut datat saavat hyvää lisänäkyvyyttä avoimissa aineistotietokannoissa. Esimerkiksi Yhteiskuntatieteellinen tietoarkisto kääntää suomenkielisten aineistojen kuvailut englanniksi ja sijoittaa ne sitten avoimiin, kansainvälisiin datatietokantoihin. Näin ulkomaiset tutkijat pääsevät käyttämään suomalaisia tutkimusaineistoja, joista heillä ei muutoin olisi tietoa.

Luovuttaessaan arkistoituja data-aineistoja jatkokäyttöön tietoarkisto antaa niille viittaustiedon ja -ohjeet, joita jatkokäyttäjän tulee noudattaa. Tätä kautta aineistot ja niiden tekijät tulevat viitatuiksi tavanomaisin tieteellisin referenssein. Runsaassa jatkokäytössä olevat tutkimusaineistot ovat merkittävä meriitti alkuperäisille kokoajille, koska silloin toisten kokoama data on laajasti hyödyllistä tiedeyhteisölle.

Asianmukaisin standardein kuvailtu ja julkaistu tutkimusaineisto on tekijöilleen tieteellinen meriitti, jonka voi ilmoittaa ansioluettelossa. Tiedeyhteisön yhteiseen ja avoimeen käyttöön avatut datat mahdollistavat tieteen itsensäkorjaavuutta ja lisäävät sen yleistä luotettavuutta. Siksi nyt valmistuneen tiekartan toimenpide-ehdotukset pitää ottaa vakavasti.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi