Tag Archives: teknologia

Yhdessä digihiiltä puhaltamaan

Viime vuosina digitalisaatio ja sen edistäminen ovat olleet julkisuuden kestopuheenaiheita. Digitalisaatio on nähty eräänlaisena viisastenkivenä ja ratkaisuna erityisesti julkisen sektorin tuottavuusongelmiin, joten siihen on ladattu valtavat odotusarvot. Kuitenkin tuoreen selvityksen mukaan  digitalisaatiohankkeet ja niiden vaatimien panostusten hinta, laatu ja laajuus olleet pettymyksiä. Odotukset ovat yksinkertaisesti jääneet lunastamatta – ainakin tähän asti. Digitalisaation kokonaisvaikutukset jäävät vähälle… Read More »

The post Yhdessä digihiiltä puhaltamaan appeared first on Vaikuttaja.

New user-friendly website for FSD

Dear reader, it is very much possible that you’re reading this after noticing that our website has been given a facelift or after reading an announcement about it.

The previous FSD website was launched over six years ago, and a lot has changed in the way people browse the web since. The former site was not very suitable for use on mobile, or even tablet, screens. Even though nothing was broken per se, the site wasn’t exactly optimised for the mobile visitor. Unlike now. We have designed our new site with accessibility in mind, and it scales responsively to different types of screens.

Of course, the website overhaul had other objectives as well. Not getting caught up in the old ways was one of them. In six years, our services have also changed a lot, and we want to bring them forward in a new way. The starting point of the redesign was that all our user groups should find the services or information they need quickly and effortlessly.

The appearance has also changed. Now everything is a bit bigger and more colourful. Our website is our most important customer service channel and our business card as well as a meeting point for data depositors and users.

Content grouping has changed

Navigating the site is now done mainly via a “mega menu” that replaces the traditional sitemap and is always accessible, regardless of which page the user is currently viewing. We hope that this will facilitate finding the relevant contents if the URLs of pages have changed. However, we primarily aim to redirect the user to the right address automatically.

Most of the content regarding datasets directly has been moved to the Aila Data Service. The new site will include instructions on searching and using research data, introductions of featured datasets and theme pages as well as links to the most recent datasets on Aila.

Everything is new under the hood

Improvements on the site are not only cosmetic. With our partner Redflow Inc., we have developed a modern content management system, based on Hugo, for generating static pages. The CMS will be used for maintaining the FSD website and publishing new content. We wanted a secure solution that we could fine-tune to meet our needs and to fit seamlessly in with our development environment.

In the future, our other services will also receive the new look. For now, many of the services offered by FSD, such as Aila, Data Management Guidelines and Research Methods Web Resource MOTV, will have the old interface. The Swedish version of the website will receive more content in the coming weeks.

A lot of work has been done for the new website, but we have surely missed something. Maybe we have forgotten to move some content to the new page. Perhaps the interface works illogically on some browsers. It might be that a link takes you to the wrong place or nowhere at all. We will be glad to receive any feedback regarding the new site (tuki.fsd at uta.fi)!

Tuomas J. Alaterä
IT Services Specialist
firstname.surname [at] uta.fi

This blog post is available also in Finnish:
Tietoarkistolle käyttäjä- ja mobiiliystävälliset uudet verkkosivut.

Tietoarkistolle käyttäjä- ja mobiiliystävälliset uudet verkkosivut

Hyvä lukija, on hyvin mahdollista, että luet tätä huomattuasi tiedotteestamme tai saapumalla sivuillemme, että Tietoarkiston verkkosivut ovat uudistuneet.

Edellisestä sivustouudistuksesta on kulunut reilut kuusi vuotta. Tänä aikana tavoissa, joilla verkkoa selataan, on tapahtunut suuria muutoksia. Aiemmat sivumme eivät soveltuneet kovin hyvin kännykän tai edes tabletin näytöllä luettavaksi. Vaikka mikään ei sinänsä ollut rikki, niitä ei oltu optimoitu mobiilikäyttäjää varten. Toisin on nyt. Uudet sivumme on suunniteltu saavutettaviksi sekä responsiivisiksi ja ne skaalautuvat erilaisille näytöille.

Uudistuksella on toki ollut muitakin tavoitteita. Yksi niistä on uudistuminen itsessään. Kuudessa vuodessa myös Tietoarkiston palveluissa on tapahtunut muutoksia, ja haluamme tuoda palveluitamme näkyviin uudella tavalla. Suunnittelussa on lähdetty siitä, että kaikki asiakasryhmät löytäisivät mahdollisimman helposti heitä koskevat palvelumme tai kiinnostavan informaation.

Myös visuaalinen tyyli on erilainen. Nyt kaikki tehdään hieman isommin ja hieman värikkäämmin. Verkkosivumme ovat keskeisin asiakaspalvelun kanavamme, datan arkistoijan ja jatkokäyttäjän kohtaamispaikka ja käyntikorttimme.

Sisältöjä ryhmitelty uusiksi

Navigointi tapahtuu pääasiassa ”megamenun” kautta. Se korvaa perinteisen sivukartan ja on saatavilla aina, riippumatta siitä, missä kohtaa sivustoa tai yksittäistä sivua käyttäjä kulloinkin on. Tämän toivomme helpottavan sisällön löytämistä myös silloin kun sivujen osoitteet ovat muuttuneet. Ensi sijassa pyrimme ohjaamaan käyttäjän automaattisesti oikeaan osoitteeseen.

Uudistuksen myötä tutkimusaineistoja suoraan käsittelevä sisältö, kuten aineistoluettelo, on siirretty palveluportaali Ailan puolelle. Verkkosivuillamme sen sijaan julkaisemme aineistoesittelyjä, taustoitamme teemakokonaisuuksia ja linkitämme aineistoihin, joka ovat saatavilla Ailassa.

Konepellin alla kaikki on uutta

Muutos ei ole ainoastaan ulkoinen. Olemme kehittäneet yhteistyökumppanimme Redflow Inc:n kanssa modernin Hugo-pohjaisen staattisten sivujen generoimiseen soveltuvan sisällönhallintakokonaisuuden, jolla Tietoarkiston sivuja ylläpidetään ja julkaistaan. Halusimme tietoturvallisen ratkaisun, jota voimme säätää tarkasti omiin tarpeisiimme soveltuvaksi ja joka sopii saumattomasti tietotekniseen kehitysympäristöömme.

Jatkossa tulemme tuomaan uuden ulkoasun myös useisiin muihin palveluihimme. Toistaiseksi mm. palveluportaali Aila, Aineistonhallinnan käsikirja ja MOTV jatkavat vanhassa kuosissaan. Ruotsinkielisille sivuille sisältöjä tulee lisää lähiviikkoina.

Uudistusta varten on tehty paljon töitä, mutta varmasti jotain on jäänyt huomaamatta. Ehkä olemme unohtaneet siirtää joitain sisältöjä uusille sivuille. Kenties käyttöliittymässä on joillain selaimilla epäloogisuuksia. Mahdollisesti jokin linkki vie väärään sisältöön tai ei minnekään? Vastaanotamme mielellämme palautetta (tuki.fsd at uta.fi)!

Tuomas J. Alaterä
IT-palveluasiantuntija
etunimi.sukunimi [at] uta.fi

Tämä blogikirjoitus on luettavissa myös englanniksi:
New user-friendly website for FSD.

Tulevaisuuden vaihtoehdot suurten datamäärien käsittelyyn: DRAS-TIC ja Brown Dog

Suuret datamassat ja niiden tarjoamat mahdollisuudet ja haasteet liitetään yleensä suurten internetjättien, kuten Googlen tai Amazonin, keräämään dataan. Mutta mielenkiintoisia laajoja datoja löytyy myös useiden arkistojen hallusta. Niiden käsittely on kuitenkin hankalaa ja riskinä on, että mahdollisuudet jäävät hyödyntämättä ja käteen jäävät vain haasteet.

Tietomassat ja formaattivelka haasteina

Ensimmäisenä haasteena vastaan tulee todennäköisesti varantojen skaalautuminen. Eli miten infra pysyy perässä, kun tiedostomäärät kasvavat dramaattisesti. Toinen haaste on formaattivelka. Formaattivelalla tarkoitetaan sitä työmäärää tai rahasummaa, joka tulevaisuudessa joudutaan käyttämään tiedostojen jatkokäyttämiseen, kun niiden lukeminen ja prosessointi on muuttunut vaikeaksi tai mahdottomaksi teknologian vanhenemisen myötä. Jos aineistoja hallinoivat tahot eivät aktiivisesti ota huomioon pitkäaikaissäilytystä, ne kerryttävät itselleen hyvin todennäköisesti formaattivelkaa.

Osallistuin helmikuussa Barcelonassa IDCC18-konferenssiin, joka on digitaalisten aineistojen kuratointiin erikoistunut vuosittainen tapahtuma. Konferenssissa Marylandin yliopiston Digital Curation Innovation Centerin johtaja Richard Marciano esitteli näihin ongelmiin vastaavaa kahta eri teknologiapakettia: DRAS-TIC:ia (Digital Repository at Scale that Invites Computation) ja Brown Dogia.

Skaalautuvat tietovarannot

DRAS-TIC on avoimen lähdekoodin horisontaalisesti skaalautuva varanto, jonka ei pitäisi kärsiä lainkaan tiedostomäärän kasvusta – jos kehittäjien mainospuheita on uskominen. Luonnollisesti palvelun ylläpitäjän täytyy pystyä kasvattamaan taustalla pyörivien palvelinten määrää. Akronyymihirviön mielenkiintoisin osa on ”that Invites Computation”, eli DRAS-TIC varannot on viritetty valmiiksi laskennallista arkistointia (computational archival science) varten, mikä tekee datasta löydettävämpää ja mahdollistaa uuden tiedon johtamisen helpommin jo olemassa olevista aineistoista.

Formaattimuutoksiin uusia työkaluja

Brown Dog on avoimen lähdekoodin työkalukokoelma, jolla prosessoidaan tiedostoja. Sen ydintoiminnot ovat tiedostojen muuntaminen formaatista toiseen ja metadatan kerääminen ja sijoittaminen hakuindeksiin. Formaattimuunnokset toteutetaan erilaisilla muuntimilla, joita tällä hetkellä on Brown Dogin työkalukatalogiin listattuna yhteensä 30.

Brown Dog -esittelyvideo

Ideana on ketjuttaa formaattimuunnoksia erilaisiksi poluiksi. Marcianon käyttämässä esimerkissä käyttäjä lähettää järjestelmään PSD 2.0 tiedoston, joka on tarkoitus muuntaa nykylaitteille sopivampaan muotoon. PSD 2.0 on vuoden 1991 PhotoShop 2.0:n työtiedostoformaatti, joten sen käsittely nykylaitteilla olisi todennäköisesti vähintäänkin hankalaa. Muuntamisen Brown Dog aloittaa käyttämällä Windows 3.0 virtuaalikonetta, johon on asennettu PhotoShop 2.0. PSD muunnetaan ensin TIFF:iksi, joka syötetään Docker-kontissa pyörivälle Linux-koneelle, ja se muuttaa kuvan ImageMagik-muuntimella JPEG 2000 -formaattiin. Esimerkissä polku on lineaarinen, mutta mikään ei estä haaroittamasta polkua ja tekemästä useita rinnakkaisia muunnoksia.

Metadatan kerääminen tiedostoista

Näillä kahdella työkalulla tiedostoista voidaan myös haravoida erilaista metadataa ja näin kartoittaa syntyvää tiedostovarantoa. Esimerkkinä voidaan käyttää tavallisen PDF-tiedoston tallettamista DRAS-TIC:ia ja Brown Dogia hyödyntävään varantoon.

Tallennus tapahtuu vaiheittain:

  1. PDF-tiedosto lähetetään tiedostovarantoon, jolloin siitä kerätään talteen tiedoston nimi, koko ja sijainti tiedostovarannossa.
  2. Tiedostosta otetaan irti sen PDF-versionumero.
  3. Tiedostosta otetaan erilleen tekstisisältö.
  4. PDF-tiedoston sisältämät kuvat skannataan tekstisisällön varalta OCR-ohjelmalla (Optical Character Recognition). Lisäksi muilla kuva-analyysityökaluilla kerätään esimerkiksi tiedot siitä, kuinka monta ihmistä kuvissa esiintyy ja minkälaisissa ympäristöissä he ovat.

Näin yhdestä PDF-tiedostosta on kerätty kohtuullisen suuri määrä metadataa, ja kun kaikki tämä metadata indeksoidaan hakuindeksiin, on tiedosto ja sen eri osat helposti löydettävissä usealla eri tavalla.

Brown Dogissa on panostettu siihen, että se on tarvittaessa laajennettavissa omilla työkaluilla, jotka voidaan sovittaa johonkin tiettyyn tehtävään. Jos esimerkiksi tiedostojen tekstisisällöt halutaan avainsanoittaa ja visualisoida varantoa niiden perusteella, voidaan nämä työvaiheet lisätä Brown Dogiin omilla työkaluilla. Näin eri tahot voivat kehittää omiin tarkoituksiinsa sopivan työvuon.

Brown Dog ja DRAS-TIC ovat vielä kehitysvaiheessa, joten aika näyttää, mitä niille lopulta käy. Onnistuessaan ne loisivat mielenkiintoisen pohjan suurten datavarantojen hallintaan ja laskennallisen arkistoinnin soveltamiseen.

Lisätietoa:

» Marciano et al., esitysdiat IDCC2018-konferenssista: Building Open‐Source Digital Curation Services & Repositories at Scale
» CNI Fall 2016 Project Briefings: DRASTIC Measures: Digital Repository at Scale that Invites Computation (To Improve Collections)
» NSCA Brown Dog
» 13th International Digital Curation Conference (IDCC)

Valtteri Kostiainen
sovelluskehittäjä
etunimi.sukunimi [at] uta.fi

Kasvot maan pinnalla

Valtavan kokoinen mustavalkoinen kuva nimettömästä lapsesta on asetettu keskelle pakistanilaista peltopalstaa. Kuvassa on lapsi, joka kuoli perheineen Yhdysvaltojen Pakistaniin toteuttamassa lennokki-iskussa syksyllä 2013. Kauko-ohjattavien lennokkien operoijat kutsuvat kuolleesta ihmisestä, osumasta, jäänyttä jälkeä ”ötökän roiskeeksi” eli pieneksi verijäljeksi, jonka kaikki tietävät esimerkiksi hyttysen elävältä läimäisemisestä pöydän pinnalle jäävän. Pakistanilaisen taidekollektiivin tarkoituksena on muistuttaa kauko-ohjattavien tappavien lennokkien … Jatka lukemista Kasvot maan pinnalla

Tietoarkisto CESSDAssa: vahvuuksiamme ovat toimivat palvelut ja käytännöt sekä luotettavuus

CESSDA ERIC -infrastruktuuria rakennetaan kiihtyvällä vauhdilla ja viimeiset kolme vuotta ovat olleet Tietoarkistolle erittäin tiiviin eurooppalaisen yhteistyön aikaa. CESSDAn keskustoimisto on pieni ja toiminta perustuu kansallisten palveluntuottajien hajautettuihin palveluihin.

Yksi CESSDAn suurimmista hankkeista, kaksivuotinen CESSDA Strengthening and Widening, lyhyemmin SAW, päättyi vuoden 2017 lopussa. Hanke sai rahoituksensa Euroopan unionin Horisontti 2020 -ohjelmasta. Nimensä mukaisesti hankkeessa sekä vahvistettiin CESSDAn toimintoja että pyrittiin saamaan uusia valtioita jäseneksi.

Hanke oli meille hyödyllinen, sillä pystyimme siinä vertailemaan Tietoarkistoa muihin eurooppalaisiin data-arkistoihin ja saamaan sitä kautta arvokasta palautetta. Lisäksi hankkeessa onnistuttiin kehittämään välineitä tietoarkistotyöhön.

Tietoarkisto edelläkävijä monella saralla

Hankkeen alkupuolella vuonna 2016 kartoitettiin eurooppalaisten data-arkistojen toimintojen vahvuuksia ja kehityskohteita. Tietoarkiston tulokset olivat suurelta osin data-arkistojen keskiarvoa paremmat. Sopimus- ja käyttöoikeuskäytäntömme, tietosuoja-asiat ja aineistojen kuvailu nousivat esille erityisen hyvinä osa-alueina. Parantamisen varaa oli teknisen infrastruktuurin puolella.


Tietoarkiston tulokset olivat suurelta osin data-arkistojen keskiarvoa paremmat. Lähde: Deliverable 3.2 Country report on development potentials
.

Akatemian FIRI 2016 -rahoitusta saanut Aktiivinen Tietoarkisto CESSDAssa -hankkeemme painottuukin juuri teknisen infrastruktuurimme parantamiseen vuosina 2017-2021.

Luotettava ja sertifioitu

Yksi CESSDAn vaatimuksista on, että palveluntuottajien on hankittava CoreTrustSeal-sertifikaatti (aikaisemmin CTS tunnettiin nimellä Data Seal of Approval). SAW-hankkeessa Tietoarkisto oli mukana kouluttamassa ja tukemassa palveluntuottajia sertifioinnissa. Hankkeen aikana Tietoarkisto päivitti oman sertifiointinsa ja saikin uusien, tiukennettujen vaatimusten mukaisen CTS-sertifikaatin ensimmäisten joukossa koko maailmassa.

Uusia työkaluja data-arkistoille

Tietoarkiston yksi painopiste SAW-hankkeessa oli tuottaa työkaluja, jotka auttavat uusia data-arkistoja aloittamaan ja olemassa olevien data-arkistojen kehittämään toimintojaan. Teimme hankkeessa Kuha2-harvointirajapinnan, joka on helposti käyttöön otettava, kevyt mutta kattava palvelinohjelmisto kuvailutietojen jakeluun. Kuha2:n lähdekoodi on avointa.

Lisäksi olimme mukana tuottamassa kustannus-hyöty-työkalupakettia data-arkistoille. Tietoarkisto laati hyöty-yhteenvedon ja kokeili kustannus-hyöty-työkaluja. Kustannus-hyötyanalyysissä emme saavuttaneet brittien data-arkiston lukemia, mikä johtunee toisaalta skaalaeduista ja toisaalta toimintamallista. Ailan käyttöönotto on kuitenkin parantanut tehokkuuttamme selvästi.

Tavoitteena hyvien käytäntöjen jakaminen

Tietoarkisto haluaa vaikuttaa aktiivisesti siihen, minkälaisia palveluita CESSDA tarjoaa tutkijoille. Toisaalta haluamme varmistaa, että omat palvelumme ovat kansainvälisten vaatimusten mukaisella tasolla. Olemme eurooppalaisittain keskikokoinen data-arkisto, joten meidän kannattaa keskittyä vahvuusalueisiimme, kun pyrimme viemään käytäntöjämme malliksi CESSDAlle ja muille palveluntuottajille. Vastaavasti on osa-alueita, joissa meidän on hyödyllistä ottaa mallia muilta. CESSDA SAW -hankkeessa otimme tärkeitä askeleita tavoitteidemme saavuttamiseksi. Jatkamme tätä työtä muun muassa olemalla mukana CESSDAn sisäisissä kehityshankkeissa.

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi

Kodin ylijäämäruoat jakoon mobiilisovelluksen avulla


Suomalaiset heittävät roskiin itse valmistamaansa ruokaa 21 miljoonaa kiloa vuodessa (lähde: Luonnonvarakeskus ja Saasyoda.fi). Syitä tähän ovat esimerkiksi, että ruokaa valmistettiin alun perinkin liikaa tai että kuluttaja ei halua syödä samaa ruokaa useana päivänä peräkkäin. Kotona itse valmistetun ruoan heittäminen roskiin on erityisen problemaattista. Vaikkapa itse tehdyn pulled porkin valmistamiseenhan on käytetty raaka-aineen (liha) sisältämän hiilijalanjäljen lisäksi myös rutkasti energiaa, kun liha on hautunut tunteja uunissa tai liedellä. Tämän lisäksi ruoan hankkimiseen, tekemiseen ja sen suunnitteluun on käytetty aikaa ja rahaa. Toisaalta täysin syömäkelpoisen ruoan poisheittäminen on aina myös eettisesti arveluttavaa, jos ruoalla voisi täyttää biojäteastian sijaan jonkun vatsan.

Yksi ratkaisu tähän haasteeseen on kodin ylijäämäruoan jakaminen muille. Perinteisesti Suomessa juhlien jälkeen ystäviä tai tuttavia on kutsuttu rääppiäisiin syömään tarjoiluista ylijäänyttä ruokaa. Kuitenkin mahdollisuus tarjota ylijäämäruokaa laajemmalle piirille tai jopa täysin tuntemattomille on ollut vähäisempää ja lähinnä oman aktiivisuuden varassa. Nyt teknologia on tullut tässä(kin) apuun, kun meillä ja maailmalla on kehitetty mobiilisovelluksia, joiden kautta kuluttaja voi jakaa eteenpäin kodin ylijäämäruokaa – joko valmiita annoksia tai itselle tarpeettomia elintarvikkeita, kuten jauhoja, valmiskastikkeita tms.

NeighbourFood on Suomessa keväällä 2017 aloittanut mobiilisovellus, jonka avulla kuluttaja voi jakaa itse tekemäänsä ruokaa muille lähistöllä asuville. Yrityksen toinen perustaja Klaus Hannus kertoi meille, että NeighbourFoodin taustalla on vahva ideologia siitä, että on väärin heittää ruokaa pois, kun samaan aikaan kärsitään nälästä ja aliravitsemuksesta. Siksi suurin osa tuotoista ohjataan hyväntekeväisyyteen. Laittamalla ruoan jakoon sovelluksen kautta kuluttaja määrittelee summan, jonka ruoan noutaja maksaa ruoasta. Maksetusta summasta 70 prosenttia ohjataan Punaiselle Ristille ja loput kattamaan NeighbourFoodin kuluja. Ruoan jakaja ei siis saa itselleen taloudellista korvausta ruoan jakamisesta, mutta hyvän mielen hävikin vähentämisestä sekä tekemästään lahjoituksesta hyväntekeväisyyteen. Itse sovellus on ilmainen.
Lähes vastaavalla periaatteella toimii myös brittiläinen mobiilisovellus Olio, joka on toiminut vuodesta 2015 taistelussa ruokahävikkiä vastaan. NeighbourFoodista Olio eroaa kuitenkin mm. siinä, että ruoan jakaja voi ehdottaa tiettyä summaa maksettavaksi ruoasta hyväntekeväisyyteen, mutta ruoan ostaja voi halutessaan saada ruoan ilmaiseksi. Ruoan jakamisen lisäksi Olion kautta on mahdollista myös osallistua vapaaehtoistoimintaan, jolla autetaan kauppoja, leipomoita ja ravintoloita jakamaan ylijäämäruokaa Olion avulla. Olion mukaan jo yli 260 000 ihmistä 41 maassa on jakanut ruokaa sovelluksen kautta.
Muista siis kurkata myös kännykkääsi seuraavan kerran kun haluat vähentää ruokahävikkiä ja samalla tehdä hyvää!
-Nina

Tekninen kehitys laajentaa tietoarkistojen toimintaa

Ensimmäiset yhteiskuntatieteelliset data-arkistot aloittivat toimintansa 1960-luvulla Yhdysvalloissa ja Euroopassa. Niiden syntyyn vaikutti keskeisesti tietokoneiden ja laajoihin surveyaineistoihin perustuvien tutkimusmenetelmien kehittyminen sekä näiden suosion nopea kasvu useilla ihmistieteellisillä aloilla. Data-arkistoja ryhdyttiin perustamaan myös kaupallisten mielipidetutkimuslaitosten yhteyteen erityisesti Yhdysvalloissa.

Data-arkistot toimivat kolme ensimmäistä vuosikymmentään ja osin vielä 1990-luvullakin keskustietokoneympäristöissä. Varsinkin tästä syystä niiden säilyttämien henkilötason tutkimusaineistojen käyttäjät olivat lähes yksinomaan tutkijoita. Sähköiset datatiedostot haettiin joko paikan päältä arkistoista tai ne kuljetettiin eri tallennevälineillä käyttäjilleen.

Kun itse tilasin 90-luvun alkupuolella Saksan yhteiskuntatieteellisestä data-arkistosta Kölnistä Eurobarometrien data-aineistoja, ne toimitettiin työhuoneeseeni Tampereelle postitse kelanauhoina. Sitten marssin tavaran kanssa yliopistomme tietokonekeskukseen, jossa tiedostot siirrettiin (maksutta) keskuskoneen käyttäjätunnukselleni. Tämän jälkeen vuorossa olivat ascii-muotoisten tiedostojen määrittelyt sellaiseen muotoon, että tilastollinen tietojenkäsittelyohjelma sai datasta tolkkua. Keskuskone oli sen verran ruuhkainen, että suurimmat tietokoneajot piti suosiolla ajoittaa suoritettavaksi illemmalla eikä työpäivän aikana.

Toisin on tänään. Vaikka en edes kuulu varhaiseen reikäkortti- ja lajittelijasukupolveen enkä ole siis värjötellyt tietojenkäsittelyn Siperiassa, olen silti todistanut mikrotietokoneiden ja Internetin vallankumouksen koko tähänastisen polun. Data-arkistoalalle teknologian nopea kehitys on tuonut useita muutoksia ja isoja haasteita. Aikaisemmin ala keskittyi data-aineistojen arkistointiin, pitkäaikaissäilytykseen ja jakeluun erityisesti tutkimuskäyttöä ajatellen. Kansainvälisessä yhteistyössä arkistot toimivat data-aineistojen välittäjinä tutkijoille siten, että kansalliset data-arkistot toimivat oman maansa tutkijoille ulkomaisten aineistojen välittäjinä.

Internet-sukupolvelle ajatus välikäsistä ja pitkistä toimitusajoista on vieras. Yhä useamman tutkijankin mielestä tutkimuksen tietoaineistojen tulisi olla ladattavissa suoraan omalle tietokoneelle luotettavista lähteistä heti ja lähtökohtaisesti myös maksutta. Lisäksi tietojen pitäisi olla vaivattomasti yhdisteltävissä muihin tietoihin ja niiden tulisi muutoinkin olla helppokäyttöisiä. Hyvä näin, sillä todellinen edistys edellyttää aina sitä, että joku vaatii muutosta. Näihin haasteisiin vastaaminen edellyttää toimivia palveluinfrastruktuureja.

Data-arkistoalalla teknologian kehitys on jo avartanut suunnattomasti tutkimusaineistojen käyttötapoja ja -mahdollisuuksia. Avoimet datatietokannat ovat lisänneet huomattavasti soveltuvien tutkimusaineistojen löytymistä ja saatavuutta. Joskus suunniteltu uusi tutkimusaineisto on jäänyt kokonaan keräämättä. Omassa toiminnassamme meitä on ilahduttanut erityisesti se, että perustutkinto-opiskelijat käyttävät tietoarkistoon arkistoituja aineistoja kasvavassa määrin omiin opinnäytetöihinsä.

Myös tietoaineistojen opetuskäytön erilaisia mahdollisuuksia tulisi oppia hyödyntämään täysipainoisesti. Data-projektori ja Internet opetustilassa mahdollistavat jo nyt eri aiheisiin liittyvien dataperustaisten online-palvelujen käytön kontaktiopetuksessa. Näin opetus perustuu ajantasaisimpaan tietoon.

Tietoarkisto on laajentamassa palvelujaan tähän suuntaan. Jo nyt muun muassa Menetelmäopetuksen tietovarannon harjoitusaineistot ovat vapaasti heti käytettävissä. Tavoitteena on myös uusia aineistojen toimitusjärjestelmä vuoden 2012 loppuun mennessä. Uudistuksen valmistuttua rekisteröityneet asiakkaat voivat hyödyntää tietoarkiston koko aineistovarantoa datatiedostoineen suoraan verkossa.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi

Tekninen kehitys laajentaa tietoarkistojen toimintaa

Ensimmäiset yhteiskuntatieteelliset data-arkistot aloittivat toimintansa 1960-luvulla Yhdysvalloissa ja Euroopassa. Niiden syntyyn vaikutti keskeisesti tietokoneiden ja laajoihin surveyaineistoihin perustuvien tutkimusmenetelmien kehittyminen sekä näiden suosion nopea kasvu useilla ihmistieteellisillä aloilla. Data-arkistoja ryhdyttiin perustamaan myös kaupallisten mielipidetutkimuslaitosten yhteyteen erityisesti Yhdysvalloissa.

Data-arkistot toimivat kolme ensimmäistä vuosikymmentään ja osin vielä 1990-luvullakin keskustietokoneympäristöissä. Varsinkin tästä syystä niiden säilyttämien henkilötason tutkimusaineistojen käyttäjät olivat lähes yksinomaan tutkijoita. Sähköiset datatiedostot haettiin joko paikan päältä arkistoista tai ne kuljetettiin eri tallennevälineillä käyttäjilleen.

Kun itse tilasin 90-luvun alkupuolella Saksan yhteiskuntatieteellisestä data-arkistosta Kölnistä Eurobarometrien data-aineistoja, ne toimitettiin työhuoneeseeni Tampereelle postitse kelanauhoina. Sitten marssin tavaran kanssa yliopistomme tietokonekeskukseen, jossa tiedostot siirrettiin (maksutta) keskuskoneen käyttäjätunnukselleni. Tämän jälkeen vuorossa olivat ascii-muotoisten tiedostojen määrittelyt sellaiseen muotoon, että tilastollinen tietojenkäsittelyohjelma sai datasta tolkkua. Keskuskone oli sen verran ruuhkainen, että suurimmat tietokoneajot piti suosiolla ajoittaa suoritettavaksi illemmalla eikä työpäivän aikana.

Toisin on tänään. Vaikka en edes kuulu varhaiseen reikäkortti- ja lajittelijasukupolveen enkä ole siis värjötellyt tietojenkäsittelyn Siperiassa, olen silti todistanut mikrotietokoneiden ja Internetin vallankumouksen koko tähänastisen polun. Data-arkistoalalle teknologian nopea kehitys on tuonut useita muutoksia ja isoja haasteita. Aikaisemmin ala keskittyi data-aineistojen arkistointiin, pitkäaikaissäilytykseen ja jakeluun erityisesti tutkimuskäyttöä ajatellen. Kansainvälisessä yhteistyössä arkistot toimivat data-aineistojen välittäjinä tutkijoille siten, että kansalliset data-arkistot toimivat oman maansa tutkijoille ulkomaisten aineistojen välittäjinä.

Internet-sukupolvelle ajatus välikäsistä ja pitkistä toimitusajoista on vieras. Yhä useamman tutkijankin mielestä tutkimuksen tietoaineistojen tulisi olla ladattavissa suoraan omalle tietokoneelle luotettavista lähteistä heti ja lähtökohtaisesti myös maksutta. Lisäksi tietojen pitäisi olla vaivattomasti yhdisteltävissä muihin tietoihin ja niiden tulisi muutoinkin olla helppokäyttöisiä. Hyvä näin, sillä todellinen edistys edellyttää aina sitä, että joku vaatii muutosta. Näihin haasteisiin vastaaminen edellyttää toimivia palveluinfrastruktuureja.

Data-arkistoalalla teknologian kehitys on jo avartanut suunnattomasti tutkimusaineistojen käyttötapoja ja -mahdollisuuksia. Avoimet datatietokannat ovat lisänneet huomattavasti soveltuvien tutkimusaineistojen löytymistä ja saatavuutta. Joskus suunniteltu uusi tutkimusaineisto on jäänyt kokonaan keräämättä. Omassa toiminnassamme meitä on ilahduttanut erityisesti se, että perustutkinto-opiskelijat käyttävät tietoarkistoon arkistoituja aineistoja kasvavassa määrin omiin opinnäytetöihinsä.

Myös tietoaineistojen opetuskäytön erilaisia mahdollisuuksia tulisi oppia hyödyntämään täysipainoisesti. Data-projektori ja Internet opetustilassa mahdollistavat jo nyt eri aiheisiin liittyvien dataperustaisten online-palvelujen käytön kontaktiopetuksessa. Näin opetus perustuu ajantasaisimpaan tietoon.

Tietoarkisto on laajentamassa palvelujaan tähän suuntaan. Jo nyt muun muassa Menetelmäopetuksen tietovarannon harjoitusaineistot ovat vapaasti heti käytettävissä. Tavoitteena on myös uusia aineistojen toimitusjärjestelmä vuoden 2012 loppuun mennessä. Uudistuksen valmistuttua rekisteröityneet asiakkaat voivat hyödyntää tietoarkiston koko aineistovarantoa datatiedostoineen suoraan verkossa.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi