Tag Archives: sovelluskehitys

Kehitämme kansallista datainfrastruktuuriamme Suomen Akatemian tuella ja yhteistyössä tiedeyhteisön kanssa

Tampereen yliopisto juhlisti yhdistynyttä korkeakouluyhteisöään Potentiaaleissa Tampere-talossa 24.1.2019. Osallistujille jaettiin tähtimerkkejä, joista kukin voi poimia kuvaavimman. Kun Suomen Akatemia oli vajaata viikkoa aiemmin myöntänyt Tietoarkiston rajoja ylittävälle C-BoTS-infrastruktuurihankkeelle viisivuotisen rahoituksen, minulle seitsemästä vaihtoehdosta tuntui osuvimmalta Fuusio. Se merkitsee ”potentiaalia tiederajojen yli”.1 Hauska idea, jolla on varmasti perinteistä horoskooppimerkkiä enemmän ennustearvoa.

Uudessa Tampereen yliopistossa Tietoarkisto jatkaa erillisyksikkönä valtakunnallisen palvelutehtävän hoitamista. Akatemian rahoitus on osoitettu juuri tämän tehtävän vahvistamiseen. Hankkeen suomenkielinen nimi on Rajoja ylittävät työkalut ja palvelut (C-BoTS): Tietoarkiston kansallinen datainfrastruktuuri 2024. Hankkeen kuusi työpakettia istuvat hyvin sekä kansallisella tutkimusinfrastruktuurien tiekartalla esitettyihin Tietoarkiston tavoitteisiin että Tietoarkiston strategiasuunnitelmaan, joka korostaa asiantuntevaa palvelua, yhteistyötä ja vastuullista avointa tiedettä.

Kuulostaa ylevältä, ja perinteiselle kriittiselle yhteiskuntatieteilijälle varmaankin hölynpölyltä, mutta hankkeemme on sisällöltään muuta kuin sanahelinää. Tietoarkisto on paitsi digiä suuressa määrin myös palvelua, jonka hoitamiseen tarvitaan asiantuntevia ihmisiä. Jotta asiantuntijamme voivat palvella tiedeyhteisöä ajanmukaisesti, on kehitettävä työkaluja, jotka helpottavat aineistojen käsittelyä ja arkistointia sekä muun muassa vähentävät raportointiin käytettyä työaikaa.

Tietoarkiston palveluarkkitehtuuri uudistetaan

Hankkeen laajimmassa työpaketissa keskitymme nykyisen palveluarkkitehtuurimme purkamiseen pienempiin osiin kokonaisuudeksi, joka mahdollistaa ulkopuolisten palvelujen ketterämmän hyödyntämisen. Uuden arkkitehtuurin myötä helpotamme myös pääsyä Tietoarkiston palveluihin ulkopuolelta erilaisten rajapintojen kautta.

Raportoinnin automatisoinnilla tietoa vaikuttavuudesta

C-BoTS-hanke lisää aineistoja arkistoivien tutkijoiden ja heidän taustaorganisaatioidensa näkyvyyttä tarjoamalla ajantasaista tietoa arkistoiduista aineistoista ja niiden tilastoja niiden käytöstä. Tietoarkiston käyttäjätilastot tuodaan ajantasaisina rahoittajien ja asiakkaiden saataville. Vastaavasti helpotamme uudella käyttöliittymällä jatkokäyttäjiltä vaadittavaa ladattujen aineistojen käytön ja julkaisutietojen raportointia.

Verkkokaupoista tuttuja ominaisuuksia ja koneoppimisen avulla tehokkaampia hakumahdollisuuksia

Palveluportaali Ailaan lisäämme verkkokaupoista tuttuja ominaisuuksia, kuten ostoskorin useiden aineistojen lataamiseen kerralla ja suositukset uusien ja samankaltaisten sisältöjen löytämiseen. Rakennamme muun muassa koneoppimista hyödyntävän käyttöliittymän, jonka avulla voimme tuottaa ja ylläpitää samankaltaisia muuttujia sisältäviä ryhmiä sekä käyttöliittymän, jonka avulla asiakkaamme pystyvät hakemaan muuttujia ja tutkimusaineistoja. Tampereen yliopiston signaalinkäsittelyn laboratorio tekoälyosaamisineen on tässä työpaketissa merkittävä kumppani.

Apuvälineitä anonymisointiin ja kvalitatiivisen aineiston hallintaan

Tietoarkisto on sähköisten laadullisten tutkimusaineistojen arkistoinnin pioneeri. Etenkin tekstimuotoisen kvalitatiivisen datan arkistointi on anonymisointivaatimusten vuoksi käsityövaltaista ja aikaa vievää. C-BoTS pyrkii helpottamaan anonymisointia arvioimalla olemassa olevia apuvälineitä kvalitatiivisen ja kvantitatiivisen aineiston anonymisointiin. Samalla kehitämme datan anonymisoinnin prosessiamme ja tuotamme ohjeistusta tutkijoille.

Päivitämme hankkeessa myös lähes kymmenen vuotta sitten julkaisemamme Kvalikirstu-ohjelmiston, joka on tehty helpottamaan kvalitatiivisen tekstimuotoisen aineiston arkistointia ja jatkokäyttöä. Uusi Kvalikirstu tuottaa nykyisiä pitkäaikaissäilytyksen vaatimuksia vastaavaa dataa ja tarjoaa jatkokäyttäjille helppokäyttöisen suomen- ja englanninkielisen käyttöliittymän. Se tukee nykyistä useampaa tiedostotyyppiä ja taustamuuttujien automaattista luomista.

Vertailevan tutkimuksen palvelu tekee yhteistyötä muiden tutkimusinfrastruktuurien kanssa

C-BoTS hankkeeseen kuuluu myös vertailevan tutkimuksen työpaketti, joka tukee muun muassa yhteistyötä Suomen ihmistieteiden ERICien kanssa ja osallistumista kahteen kansainvälisesti vertailevaan aineistosarjaan. Koska emme saaneet kaikkea hakemaamme rahoitusta, arvioimme tämän työpaketin sisältöä uudelleen. Erityisesti joudumme pohtimaan, millä vuosittainen International Social Survey Programme -sarjan aineistonkeruu rahoitetaan.

Me tietoarkistolaiset olemme joka tapauksessa erittäin tyytyväisiä valtakunnallisen tehtävän kehittämiseen saamastamme rahoituksesta ja ryhdymme toteuttamaan projektisuunnitelmaa, missä kotimainen yhteistyö tiedeyhteisön ja muiden avoimen tieteen toimijoiden kanssa on ensiarvoisen tärkeätä.

Samalla toivotan kaikki tervetulleiksi viettämään Tietoarkiston 20-vuotisjuhlavuotta kanssamme!

1Muut tähtimerkit olivat röntgen, tekoäly, Sokrates, terawatti, fresko ja Äiti Teresa.

Lisätietoa:

» Rahoituspäätös Suomen Akatemian sivuilla
» Suomen tutkimusinfrastruktuurien strategia ja tiekartta 2014-2020
» Tietoarkiston strategia (pdf)

Helena Laaksonen
johtaja
etunimi.sukunimi [at] tuni.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Matka Kööpenhaminaan

Yhteiskuntatieteellinen tietoarkisto laajentaa toimintaansa terveystieteisiin ja humanistisille aloille ja tätä varten palkkasi kaksi uutta työntekijää vuoden 2015 alusta. Sain kunnian tulla valituksi toiseksi heistä, terveystieteiden tieteenala-asiantuntijaksi.

Ensimmäinen kansainvälinen tehtävä oli osallistua pohjoismaiseen kokoukseen Kööpenhaminassa 28.–29.1., aiheena Making Nordic Health Data Visible -projekti. Projektin rahoitus on tarkoitettu sekä verkostoitumiseen pohjoismaisten terveysdataa arkistoivien ja jakavien data-arkistojen kanssa että prototyypin rakentamiseen portaalista, joka mahdollistaisi joustavan aineistojen löytämisen Pohjoismaissa tuotetuista terveysaineistoista.

Portaalille olisi hyvinkin tarvetta, sillä terveysaineistot ovat hajallaan eri rekisteriaineistojen haltijoilla sekä yksittäisillä tutkimusryhmillä ja -laitoksilla, ja käytännöt vaihtelevat maittain. Aineistoja tarvitsevien tutkijoiden, erityisesti Pohjoismaiden välisiä vertailuja tekevien, työ on miltei mahdotonta, kun tietoja eri aineistoista ei ole keskitetysti saatavilla.

Sää oli hyvin pilvinen ja kostea kun kone laskeutui. Kööpenhaminan keskustassa vanhoista kivirakennuksista sai vain häivähdyksen, miltä siellä näyttäisi hyvällä säällä auringon paistaessa, kun kaikki ei olisi märkää ja harmaata.

Kokous pidettiin Tanskan Kansallisarkistossa, historiallisessa Christiansborgissa, osassa joka rakennettiin 1720 arkistolaitosta ja kuninkaallista kirjastoa varten. Arkistolaitoksen historia ulottuu aina 1200-luvun loppupuolelle, varsinainen Kansallisarkisto perustettiin kahden vanhemman arkiston yhdistyessä 1889. Kävelimme käytävillä ja portaikoissa, joita kirjastonhoitajat ja arkistoijat olivat kulkeneet vuosisatojen ajan.

Ensimmäinen kokoustila ei valitettavasti sijainnut missään historiallisessa kamarissa. Vaikuttavan kivisen kierreportaikon päässä saavuimme tilaan, joka oli hyvin matala ja sisustettu modernin valkoiseksi ja lasiseksi. Vanhoista ikkunoista näkyi vain muutama kymmenen senttiä ylälaidasta, huonetta hallitsivat metallipinnoitteiset ilmastointiputket.

Kokousta eivät kuitenkaan tee ympäröivät seinät vaan ihmiset niiden sisällä. Paikalla oli data-arkistoinnin asiantuntijoita ja teknistä henkilökuntaa suomalaisten lisäksi Tanskasta, Ruotsista ja Norjasta.

Aluksi kokoonnuimme kaikki yhdessä kertaamaan, mikä projektin tavoite oli ja miten etenemme.

Lounaan jälkeen jakaannuimme kahteen ryhmään: aineistoasiantuntijat pohtimaan portaalin sisällöllistä puolta, erityisesti käyttöön tulevaa sanastoa, tekninen väki keskustelemaan portaalin käytännön toteuttamisesta.

Seuraavana päivänä oli yhteiskokous tanskalaisten terveysalan tutkijoiden kanssa, jotta saisimme palautetta ja kuullaksemme millaisia asioita he portaalilta odottavat ja minkälaisia tarpeita sen rakentamisessa olisi syytä ottaa huomioon. Hyvän kokemuksen perusteella päätimme kutsua tutkijoita paikalle myös projektin seuraavaan suureen kokoontumiseen lokakuussa Tampereelle.

Lopuksi muokkasimme aikataulua; erityisesti ohjelmoinnille olisi syytä varata paljon enemmän aikaa kuin aiemmin oli suunniteltu. Ohjelmoijat tapaavat jo alkukesästä Norjan Bergenissä ”hackathonissa”, jolloin muutaman päivän aikana tehdään suuri osa ohjelmointityöstä kerralla.

Kaikkea ei kuitenkaan voida tehdä kokonaan muutaman tapaamisen aikana ja työ jatkuu nyt verkon välityksellä jokaisen edistäessä omaa osuuttaan projektista. Nykytekniikalle voi olla kiitollinen sen mahdollistaessa samanaikaisen ohjelmoinnin eri puolilla maailmaa, samoin sisällön tuottaminen on mahdollista samanaikaisesti eri versioiden sekaantumatta toisiinsa.

Lisätietoa:
» Making Nordic Health Data Visible
» Rigsarkivet

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi