Tag Archives: humanistiset tieteet

Puolueohjelmissa riittää pohdittavaa

Onko puolueiden kannoissa merkittäviä eroja vai ajavatko kaikki samaa? Kiinnostaako jokin aihealue erityisesti? Mitä mieltä puolueet ovat esim. ympäristöstä, kulttuurista tai maahanmuutosta?

Vastauksia näihin kysymyksiin voi lähteä etsimään POHTIVAsta eli Poliittisten ohjelmien tietovarannosta, jonne on koottu suomalaisten puolueiden ohjelmia ja poliittisia tekstejä alkaen aina vuodesta 1880 tähän päivään. Pohtiva palvelee kaikkia puolueohjelmista kiinnostuneita, mutta erityisesti Pohtivan materiaaleja kannattaa hyödyntää tutkimuksessa ja opinnäytteissä. Itselleni Pohtiva on tullut tutuksi, sillä olen viime kesästä työskennellyt Tietoarkistossa ja työtehtävänäni on ollut paikallistaa uusia puolueohjelmia ja viedä niitä Pohtivaan.

Työntekijän puolelta katsottuna ohjelmien paikallistaminen ja käsitteleminen julkaisukuntoon ennen niiden lisäämistä Pohtivaan vie aikaa, mutta näin palvelusta saadaan käyttäjille mahdollisimman toimiva ja hyödyllinen. Erityisesti opiskelijana arvostan sitä, että puolueohjelmat on koottu samaan paikkaan, jolloin ne ovat helposti haettavassa ja tutkittavassa muodossa. Valmis aineisto säästää aikaa etsimiseltä ja tutkija pääsee suoraan analysointivaiheeseen. Yhdenmukaisessa tekstimuodossa olevat ohjelmat mahdollistavat sen, että niihin voi kohdistaa sanahakuja, ja hakutoiminnon avulla ohjelmia voi rajata puolueen, kielen, vuoden tai ohjelmatyypin mukaan.

Erityyppisten ohjelmien löytämisen helpottamiseksi Pohtivassa puolueohjelmat on jaoteltu yleis-, vaali ja erityisohjelmiin. Lisäksi kategoriassa ”muut ohjelmat” on muita poliittisia tekstejä, jotka ovat ohjelmallisia, mutta eivät kuitenkaan sovellu edellä mainittuihin ryhmiin. Ohjelmat Pohtivassa ovat pääasiassa suomen, ruotsin ja englannin kielellä.

Yli tuhat ohjelmaa

Pohtivan käytettävyyttä lisää se, että Tietoarkisto pyrkii pitämään varannon mahdollisimman kattavana ja näin ollen sitä täydennetään koko ajan. Viime aikoina kokoelma on karttunut sadoilla ohjelmilla ja tällä hetkellä Pohtivassa on yli 1300 ohjelmaa. Erityisesti puolueiden ohjelmalistat ovat täydentyneet 2000-luvulla tehdyillä erityisohjelmilla, mutta myös muihin kategorioihin on tullut uusia ohjelmia.

Opiskelijan näkökulmasta katsottuna puolueohjelmat tarjoavat materiaalia opinnäytetöihin, joko tutkittavaksi aineistoksi tai taustamateriaaliksi. Ohjelmia kannattaa tutkailla avoimin mielin, sillä politiikan tutkimuksen lisäksi ne soveltuvat materiaaliksi myös monille muille tieteenaloille. Ohjelmien kieli on välillä rikasta, ja niistä välittyy kirjoittamisajan aikakauden henki ja ajankohtaiset ongelmat. Tietokannan sisältöä ovatkin hyödyntäneet muun muassa kielentutkijat, historioitsijat, kulttuurintutkijat ja sosiologit. Erityisohjelmissa otetaan kantaa laajasti eri yhteiskunnan osa-alueisiin, joten perehtyä voi myös vain johonkin tiettyyn yhteiskunnalliseen kysymykseen.

Suosittelen lämpimästi tutustumaan Pohtivaan ja sen tarjoamiin mahdollisuuksiin.

Lisätietoa:

» Pohtiva – Poliittisten ohjelmien tietovaranto

Katri Laiho
tutkimusapulainen
etunimi.sukunimi [at] uta.fi

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

”Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin.”

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?

Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kun historiantutkijat vaelsivat Joensuuhun – Historiantutkimuksen päivät 22.–24.10.2015 Itä-Suomen yliopistossa

Olo oli oudolla tapaa nostalginen, kun juna kolisutteli pimeää rataosuutta Pieksämäeltä kohti Joensuuta. Vielä hetken on Pohjois-Karjalan maakuntakeskus tavoitettavissa junaillen; maaliskuun 2016 jälkeen sinne ei enää pääse Tampereelta Jyväskylän ja Pieksämäen kautta. Käsillä olivat siis viimeiset hetket vierailla junantuomana Pielisjoen suulle asettuneessa kaupungissa.

Joensuun vierailun syynä olivat 22.–24.10.2015 järjestetyt Historiantutkimuksen päivät, jotka keräsivät kokoon Itä-Suomen yliopiston kampukselle noin 260 historioitsijaa Suomen kaikista historian laitoksista – ja kirsikkana kakun päällä yhden tietoarkistolaisen. Sessioita ja työryhmiä oli kolmen päivän aikana noin seitsemänkymmentä ja esitykset kattoivat aikakausia antiikista nykypäivään. Lisäksi ohjelmaan sisältyi kaksi keynote-luentoa sekä seurustelun ja verkostoitumisen mahdollistavia iltatilaisuuksia. Otolliset ainekset jossain vaiheessa yleensä iskevälle konferenssikoomalle olivat siis lupaavasti kasassa.

Tietoarkistolaisen näkökulmasta päiville osallistumisella oli selkeä tarkoitus: Digitaalisten tutkimusaineistojen avoimuuden ja jatkokäytön edistäminen ei ole vielä vakiintunut humanististen alojen tutkimuskäytöntöihin. Tietoarkiston laajentaessa palveluitaan humanistisille aloille tutkijoiden joukkoon jalkautuminen ja tutkimusaineistojen avoimuuden ilosanoman julistaminen ovat siten ensiarvoisen tärkeitä asioita. Parin päivän aikana käymistäni keskusteluista kävi kuitenkin selväksi, että historiantutkijat alkavat olla enenevässä määrin selvillä avoimen tieteen vaatimuksista tutkimusaineistojen suhteen, ja moni tuntui suhtautuvan asiaan pohjimmiltaan myönteisesti. Tutkimusrahoittajien, kuten Suomen Akatemian suositukset tutkimusaineistojen avaamisesta ovat vaikuttaneet ja vaikuttavat jatkossakin siihen, että tutkijat joutuvat aiempaa aktiivisemmin pohtimaan aineistojen arkistoimiseen ja jatkokäyttöön liittyvää tematiikkaa.

Niinä aikoina, kun en päivystänyt Tietoarkiston pöydän takana, kävin kuuntelemassa esityksiä. Sessioiden valintaan vaikuttivat omat intressini sekä tietoarkistolaisena että keskiajan taiteen tutkijana. Taidehistorian koulutuksen saaneena kuvien tutkijana minua kiinnosti kovasti kuulla, miten historioitsijat käsittelevät ja tutkivat visuaalista aineistoa. Valitsin siten ensimmäiseksi session, jossa käsiteltiin sosiaalisen median kuvamateriaalia, kotialbumien sota-ajan kuvia sekä SA-kuva-arkiston sotavalokuvia digitaalisen humanismin näkökulmasta. Historioitsijat ovat tyypillisesti tottuneet suuntaamaan analyyttisen katseensa ensisijaisesti kohti tekstejä, mutta visuaalinen aines on ehkä historian tutkimuksessa pikkuhiljaa liikahtamassa kuriositeetin tai kuvituksen roolistaan kohti tutkimuksellista keskiötä – tai ainakin sen liepeitä. Historian tutkijat ovat perinteisesti herkkiä kontekstille, ja tämä näkyi onneksi myös esityksissä, vaikka taiteen tutkimuksen näkökulmasta paljon on vielä opittavaa.

Nosteessa olevan digitaalisen humanismin tai tuttavallisemmin digihumanismin tuotteena luodaan usein erilaisia datan visualisointeja ja esimerkiksi esitellyn SA-kuva-arkiston sisällön analyysit olivat muuntuneet kuvapilven muotoon. Erilaiset kuvapilvet havainnollistivat tässä tapauksessa graafisesti eri valokuvien kuvateksteistä poimittujen käsitteiden merkitystä. Datan visualisointi on eittämättä kiinnostava ja havainnollistava tapa esittää kerättyä tietoa, mutta valokuviin liittyvien kuvatekstien muodostamat visualisoinnit nostavat väistämättä sanat merkityksellisempään asemaan kuin varsinaiset kuvat. Tekstintutkija ei tässä välttämättä näe mitään ongelmaa, kuvantutkija kylläkin.

Listalleni päätyi seuraavaksi perinteisempää historiantutkimuksen metodiikkaa kuten keskiajan ja uuden ajan lähdetutkimusta Turun tuomiokirkon Mustasta kirjasta voudintileihin ja Flemingien maakirjoihin. Suuri osa historiantutkijoiden työajasta kuluu edelleen kirjallisen lähdeaineiston analysointiin, eikä sen keskeisyys ole katoamassa. Itselleni kiinnostavaa oli kuulla muun muassa lähdeteoksissa käytetyn paperin vesileima-ajoituksista, joiden perusteella on mahdollista hahmottaa käsikirjojen alkuperäinen kokonaisuus sekä tehdä esimerkiksi melko tarkkoja ajoituksia sen suhteen, milloin jonkin tietyn käsikirjoituksen jokin osa on kirjoitettu tai kuinka monta kirjuria työtä on ollut tekemässä. Toisaalta perinteinen lähdetutkimus voi nykyään kiinnittyä luontevasti digitaaliseen alustaan ja muuntua tietokannaksi, kuten digihumanismin ja perinteikkään historiantutkimuksen ristipaineessa tempoileva voudintilien tutkija aprikoi.

Tässä yhteydessä mainittiin myös itselleni aikaisemmin tuntematon termi ”small big data”, joka viittaa määrällisesti pieneen mutta luonteeltaan ”suureen” dataan, siis eräänlaiseen big datan miniversioon. Puhe big datasta sisältää usein eräänlaisen eeppisen mittasuhteen; määritelläänhän se tyypillisesti valtavista, osin järjestäytymättömistä ja jatkuvasti lisääntyvistä tietomassoista koostuvaksi datamassaksi. Tiedonkeruun kannalta yksittäinen tutkija voi tuntea kauhua määrällisesti valtaisan ja alati laajentuvan tietovarannon kanssa, joten lienee tarpeen pilkkoa käsitettä pienempiin ja paremmin hallittaviin kokonaisuuksiin.

Viimeinen sessio, johon minun oli mahdollista osallistua, käsitteli historiantutkimuksen sähköisiä tutkimusinfrastruktuureja. Esitykset keskittyivät Kansallisarkiston erilaisiin sähköisiin palveluihin, erityisesti digitoitujen karttojen paikkatietojärjestelmän kehittämiseen, heraldisten kokoelmien tietokannan luomiseen ja Suomen keskiajan käsikirjoitusten sähköisen kokoelmatietokannan, Diplomatarium Fennicumin kehittämiseen. Näiden erilaisten sähköisten palvelujen kehittäminen on osa Kansallisarkiston laajempaa tutkimuspalvelustrategiaa, jonka avulla pyritään paremmin vastaamaan erilaisten käyttäjien toiveisiin.

Kuulemieni esitysten perusteella historiantutkimuksen nykytilasta jäi ehkä päällimmäisenä pinnalle digitalisaation haasteet ja sen mukanaan tuomat uudet sovellukset, joita hyödyntämällä tieteenalan on mahdollista suunnata hyvinkin kiinnostaville urille – unohtamatta kuitenkaan perusydintään, lähdekriittistä ja kontekstiherkkää tutkimusotetta.

Historiantutkimuksen päivistä muualla blogosfäärissä:
» Kaisa Kyläkoski: Historiantutkimuksen päivät
» Susanna Ånäs: Olemmeko kaikki historioitsijoita?
» Maria Lähteenmäki: Minne menet historiantutkijoiden ammattikunta tekno-oligarkkien paineen alla?

Lisätietoa:
» SA-kuva-arkisto
» Historiantutkimuksen päivät 2015

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Kun historiantutkijat vaelsivat Joensuuhun – Historiantutkimuksen päivät 22.–24.10.2015 Itä-Suomen yliopistossa

Olo oli oudolla tapaa nostalginen, kun juna kolisutteli pimeää rataosuutta Pieksämäeltä kohti Joensuuta. Vielä hetken on Pohjois-Karjalan maakuntakeskus tavoitettavissa junaillen; maaliskuun 2016 jälkeen sinne ei enää pääse Tampereelta Jyväskylän ja Pieksämäen kautta. Käsillä olivat siis viimeiset hetket vierailla junantuomana Pielisjoen suulle asettuneessa kaupungissa.

Joensuun vierailun syynä olivat 22.–24.10.2015 järjestetyt Historiantutkimuksen päivät, jotka keräsivät kokoon Itä-Suomen yliopiston kampukselle noin 260 historioitsijaa Suomen kaikista historian laitoksista – ja kirsikkana kakun päällä yhden tietoarkistolaisen. Sessioita ja työryhmiä oli kolmen päivän aikana noin seitsemänkymmentä ja esitykset kattoivat aikakausia antiikista nykypäivään. Lisäksi ohjelmaan sisältyi kaksi keynote-luentoa sekä seurustelun ja verkostoitumisen mahdollistavia iltatilaisuuksia. Otolliset ainekset jossain vaiheessa yleensä iskevälle konferenssikoomalle olivat siis lupaavasti kasassa.

Tietoarkistolaisen näkökulmasta päiville osallistumisella oli selkeä tarkoitus: Digitaalisten tutkimusaineistojen avoimuuden ja jatkokäytön edistäminen ei ole vielä vakiintunut humanististen alojen tutkimuskäytöntöihin. Tietoarkiston laajentaessa palveluitaan humanistisille aloille tutkijoiden joukkoon jalkautuminen ja tutkimusaineistojen avoimuuden ilosanoman julistaminen ovat siten ensiarvoisen tärkeitä asioita. Parin päivän aikana käymistäni keskusteluista kävi kuitenkin selväksi, että historiantutkijat alkavat olla enenevässä määrin selvillä avoimen tieteen vaatimuksista tutkimusaineistojen suhteen, ja moni tuntui suhtautuvan asiaan pohjimmiltaan myönteisesti. Tutkimusrahoittajien, kuten Suomen Akatemian suositukset tutkimusaineistojen avaamisesta ovat vaikuttaneet ja vaikuttavat jatkossakin siihen, että tutkijat joutuvat aiempaa aktiivisemmin pohtimaan aineistojen arkistoimiseen ja jatkokäyttöön liittyvää tematiikkaa.

Niinä aikoina, kun en päivystänyt Tietoarkiston pöydän takana, kävin kuuntelemassa esityksiä. Sessioiden valintaan vaikuttivat omat intressini sekä tietoarkistolaisena että keskiajan taiteen tutkijana. Taidehistorian koulutuksen saaneena kuvien tutkijana minua kiinnosti kovasti kuulla, miten historioitsijat käsittelevät ja tutkivat visuaalista aineistoa. Valitsin siten ensimmäiseksi session, jossa käsiteltiin sosiaalisen median kuvamateriaalia, kotialbumien sota-ajan kuvia sekä SA-kuva-arkiston sotavalokuvia digitaalisen humanismin näkökulmasta. Historioitsijat ovat tyypillisesti tottuneet suuntaamaan analyyttisen katseensa ensisijaisesti kohti tekstejä, mutta visuaalinen aines on ehkä historian tutkimuksessa pikkuhiljaa liikahtamassa kuriositeetin tai kuvituksen roolistaan kohti tutkimuksellista keskiötä – tai ainakin sen liepeitä. Historian tutkijat ovat perinteisesti herkkiä kontekstille, ja tämä näkyi onneksi myös esityksissä, vaikka taiteen tutkimuksen näkökulmasta paljon on vielä opittavaa.

Nosteessa olevan digitaalisen humanismin tai tuttavallisemmin digihumanismin tuotteena luodaan usein erilaisia datan visualisointeja ja esimerkiksi esitellyn SA-kuva-arkiston sisällön analyysit olivat muuntuneet kuvapilven muotoon. Erilaiset kuvapilvet havainnollistivat tässä tapauksessa graafisesti eri valokuvien kuvateksteistä poimittujen käsitteiden merkitystä. Datan visualisointi on eittämättä kiinnostava ja havainnollistava tapa esittää kerättyä tietoa, mutta valokuviin liittyvien kuvatekstien muodostamat visualisoinnit nostavat väistämättä sanat merkityksellisempään asemaan kuin varsinaiset kuvat. Tekstintutkija ei tässä välttämättä näe mitään ongelmaa, kuvantutkija kylläkin.

Listalleni päätyi seuraavaksi perinteisempää historiantutkimuksen metodiikkaa kuten keskiajan ja uuden ajan lähdetutkimusta Turun tuomiokirkon Mustasta kirjasta voudintileihin ja Flemingien maakirjoihin. Suuri osa historiantutkijoiden työajasta kuluu edelleen kirjallisen lähdeaineiston analysointiin, eikä sen keskeisyys ole katoamassa. Itselleni kiinnostavaa oli kuulla muun muassa lähdeteoksissa käytetyn paperin vesileima-ajoituksista, joiden perusteella on mahdollista hahmottaa käsikirjojen alkuperäinen kokonaisuus sekä tehdä esimerkiksi melko tarkkoja ajoituksia sen suhteen, milloin jonkin tietyn käsikirjoituksen jokin osa on kirjoitettu tai kuinka monta kirjuria työtä on ollut tekemässä. Toisaalta perinteinen lähdetutkimus voi nykyään kiinnittyä luontevasti digitaaliseen alustaan ja muuntua tietokannaksi, kuten digihumanismin ja perinteikkään historiantutkimuksen ristipaineessa tempoileva voudintilien tutkija aprikoi.

Tässä yhteydessä mainittiin myös itselleni aikaisemmin tuntematon termi ”small big data”, joka viittaa määrällisesti pieneen mutta luonteeltaan ”suureen” dataan, siis eräänlaiseen big datan miniversioon. Puhe big datasta sisältää usein eräänlaisen eeppisen mittasuhteen; määritelläänhän se tyypillisesti valtavista, osin järjestäytymättömistä ja jatkuvasti lisääntyvistä tietomassoista koostuvaksi datamassaksi. Tiedonkeruun kannalta yksittäinen tutkija voi tuntea kauhua määrällisesti valtaisan ja alati laajentuvan tietovarannon kanssa, joten lienee tarpeen pilkkoa käsitettä pienempiin ja paremmin hallittaviin kokonaisuuksiin.

Viimeinen sessio, johon minun oli mahdollista osallistua, käsitteli historiantutkimuksen sähköisiä tutkimusinfrastruktuureja. Esitykset keskittyivät Kansallisarkiston erilaisiin sähköisiin palveluihin, erityisesti digitoitujen karttojen paikkatietojärjestelmän kehittämiseen, heraldisten kokoelmien tietokannan luomiseen ja Suomen keskiajan käsikirjoitusten sähköisen kokoelmatietokannan, Diplomatarium Fennicumin kehittämiseen. Näiden erilaisten sähköisten palvelujen kehittäminen on osa Kansallisarkiston laajempaa tutkimuspalvelustrategiaa, jonka avulla pyritään paremmin vastaamaan erilaisten käyttäjien toiveisiin.

Kuulemieni esitysten perusteella historiantutkimuksen nykytilasta jäi ehkä päällimmäisenä pinnalle digitalisaation haasteet ja sen mukanaan tuomat uudet sovellukset, joita hyödyntämällä tieteenalan on mahdollista suunnata hyvinkin kiinnostaville urille – unohtamatta kuitenkaan perusydintään, lähdekriittistä ja kontekstiherkkää tutkimusotetta.

Historiantutkimuksen päivistä muualla blogosfäärissä:
» Kaisa Kyläkoski: Historiantutkimuksen päivät
» Susanna Ånäs: Olemmeko kaikki historioitsijoita?
» Maria Lähteenmäki: Minne menet historiantutkijoiden ammattikunta tekno-oligarkkien paineen alla?

Lisätietoa:
» SA-kuva-arkisto
» Historiantutkimuksen päivät 2015

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Sähköistä säilyttämistä ja sporttista tunnelmaa Dublinissa

Gaelilaisten urheilulajien suorituspaikka, Dublinin Croke Park –stadion saattaa aluksi tuntua melko erikoiselta paikalta järjestää digitaaliseen säilyttämiseen keskittyvä konferenssi. Onko tauoilla kenties tarkoitus pelata hurlingia tai gaelilaista käsipalloa? Pitääkö varoa, ettei joudu lounasjonossa taklatuksi? Nämä huolet osoittautuivat turhiksi, sillä sporttisesta ympäristöstään huolimatta kesäkuun lopulla stadionilla järjestetyssä The 1st Annual Conference on Digital Preservation for the Arts, Social Sciences and Humanities –konferenssissa (DPASSH) ei tarvinnut pelätä, että hiki nousisi pintaan ainakaan liikkumisesta. Ainoat lihaksetkin, jotka rasittuivat, olivat lähinnä istumalihaksia, sillä kaksipäiväisen konferenssin ohjelma oli tiivis.

Konferenssin tarkoituksena oli keskittyä erityisesti sellaisiin digitaalisen säilyttämisen haasteisiin, jotka ovat tyypillisiä humanistisille ja yhteiskuntatieteellisille aloille sekä taiteen tutkimukselle. Sen sponsorina toimi The Digital Repository of Ireland (DRI), joka oli näkyvässä roolissa koko konferenssin ajan. DRI on kansallinen infrastruktuuri, joka pyrkii säilyttämään, hoitamaan ja välittämään Irlannin kulttuuriperintöaineistoja sekä humanistista ja yhteiskuntatieteellistä dataa. Säilyttämisperiaate nousee aivan uuteen valoon, kun otetaan huomioon, että vuonna 1922 sisällissodan melskeissä tapahtunut asiakirja-arkiston (The Public Record Office of Ireland) tulipalo tuhosi suurimman osan Irlannin historiallisesta asiakirja-aineistosta 1200-luvun taitteesta vuoteen 1922. DRI:n tarkoituksena onkin kootusti kerätä yhteen olemassa olevat historian ja nykypäivän tietoaineistot tutkimuksen, opiskelun ja suuren yleisön saataville. DRI:lle on lisäksi heinäkuun alussa myönnetty arvostettu Data Seal of Approval –sertifikaatti, joka myönnetään organisaatioille, jotka säilyttävät sähköisiä aineistoja luotettavasti sekä mahdollistavat niiden jatkokäytön.

Konferenssin osallistujalista oli melko irlantilaisvoittoinen, mutta ilokseni mukaan oli eksynyt myös pohjoismainen kollega, Ruotsin tietoarkiston eli SND:n kieliaineistoista vastaava Caspar Jordan. Myös CSC oli lähettänyt paikalle KDK-PAS-hankkeen (Kansallinen Digitaalinen Kirjasto – Pitkäaikaissäilytys) kehitystyössä mukana olleen it-puolen edustajan. KDK:n perusideahan on hyvin samankaltainen kuin DRI:n, toisin sanoen digitaalisten kulttuuriperintöaineistojen keskitetyn pitkäaikaissäilytyspalvelun suunnittelu ja toteuttaminen.

Konferenssin punaisena lankana toimikin huoli ja vastuu valtavien aineistomassojen säilymisestä ja säilyttämisestä. Kun jo puhtaasti analogista historiallista, taiteellista, yhteiskuntatieteellistä ja kulttuuriperintöön liittyvää aineistoa on valmiina kilometrikaupalla, tuo omat haasteensa nykyinen digitaalinen aika, joka tuottaa jatkuvalla syötöllä valtavia, yli ymmärryksen käyviä aineistomassoja. Osa esityksistä pohdiskelikin erityisesti sitä, miten sovittaa analogiset aineistot digitaalisiin työnkulkuihin. Toisaalta taas osa esityksistä keskittyi nimenomaisesti jatkuvasti tuotettuun digitaaliseen materiaaliin ja sen mielekkääseen säilyttämiseen. Kuinka alati karttuvaa aineistoa (esimerkiksi Facebookissa, Twitterissä, e-lehdissä, jne.) saa talteen sitä vauhtia kuin sitä tuotetaan ja onko kaiken säilyttäminen ylipäätään mielekästä? Nykyisen digitalisoitumisen myötä erilaiset aineistot ovat lisäksi varsin hyvin saatavilla, mutta haasteita luo niiden pitkäaikaissäilytyksen turvaaminen, omistajuuteen niveltyvät kysymykset tai teknisiin ratkaisuihin liittyvät seikat.

Pääosassa olivat aineistot ja sisällöt, paikoin myös teoreettiset lähestymistavat tai aineiston hallinnan kysymykset. Melko monen esityksenpitäjän taustaorganisaatio tai projekti oli sellainen, jossa arkistoinnin lisäksi myös aktiivisesti digitoidaan aineistoja. Erilaisten esimerkkitapausten avulla avattiin sisällöllisiä ja käytännöllisiä ratkaisuja säilyttämiskysymyksiin. Muuan esitys viihdytti yleisöä esittelemällä varhaisen, 1990-lopun online-taideprojektin, The Bono Probability Positioning Systemin, joka toimi eräällä tapaa Google Street View -sovelluksen edeltäjänä. Sen ideana oli liittää erinäisiin Dublinin karttakohteisiin todennäköisyyslaskelma siitä, miten suurella todennäköisyydellä paikassa saattoi törmätä U2-yhtyeen nokkamieheen Bonoon. Projekti oli kieli poskessa luotu ja todennäköisyyslaskelmat täysin hatusta temmattuja. Projekti toimi kuitenkin hyvänä esimerkkinä siitä, millaisia haasteita on pyrkimyksessä säilyttää vanhempaa nettiin luotua digitaalista sisältöä, jota ei alun perin ole ajateltu säilytettäväksi. Perinteisempää ja arkistoalalle tyypillisempiä ongelmia pohdittiin muun muassa esityksissä, jossa esiteltiin arkaluontoiseen aineistoon liittyviä eettisiä ongelmia tai metadatan käsittelyä.

Kodikasta humanistihenkeä ja yhdessä tekemisen ilosanomaa huokunut konferenssi oli leppoisa kokemus, joka kuitenkin tarjosi melko monipuolisen kattauksen digitaalisten aineistojen kirjavaan maailmaan. Konferenssin irlantilaiset järjestäjät toivoivatkin, että DPASSH muodostuisi jokavuotiseksi. Tämän toiveen allekirjoitan mielihyvin.

Lisätietoa:
» DPASSH 2015
» The Digital Repository of Ireland
» The Bono Probability Positioning System

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Sähköistä säilyttämistä ja sporttista tunnelmaa Dublinissa

Gaelilaisten urheilulajien suorituspaikka, Dublinin Croke Park –stadion saattaa aluksi tuntua melko erikoiselta paikalta järjestää digitaaliseen säilyttämiseen keskittyvä konferenssi. Onko tauoilla kenties tarkoitus pelata hurlingia tai gaelilaista käsipalloa? Pitääkö varoa, ettei joudu lounasjonossa taklatuksi? Nämä huolet osoittautuivat turhiksi, sillä sporttisesta ympäristöstään huolimatta kesäkuun lopulla stadionilla järjestetyssä The 1st Annual Conference on Digital Preservation for the Arts, Social Sciences and Humanities –konferenssissa (DPASSH) ei tarvinnut pelätä, että hiki nousisi pintaan ainakaan liikkumisesta. Ainoat lihaksetkin, jotka rasittuivat, olivat lähinnä istumalihaksia, sillä kaksipäiväisen konferenssin ohjelma oli tiivis.

Konferenssin tarkoituksena oli keskittyä erityisesti sellaisiin digitaalisen säilyttämisen haasteisiin, jotka ovat tyypillisiä humanistisille ja yhteiskuntatieteellisille aloille sekä taiteen tutkimukselle. Sen sponsorina toimi The Digital Repository of Ireland (DRI), joka oli näkyvässä roolissa koko konferenssin ajan. DRI on kansallinen infrastruktuuri, joka pyrkii säilyttämään, hoitamaan ja välittämään Irlannin kulttuuriperintöaineistoja sekä humanistista ja yhteiskuntatieteellistä dataa. Säilyttämisperiaate nousee aivan uuteen valoon, kun otetaan huomioon, että vuonna 1922 sisällissodan melskeissä tapahtunut asiakirja-arkiston (The Public Record Office of Ireland) tulipalo tuhosi suurimman osan Irlannin historiallisesta asiakirja-aineistosta 1200-luvun taitteesta vuoteen 1922. DRI:n tarkoituksena onkin kootusti kerätä yhteen olemassa olevat historian ja nykypäivän tietoaineistot tutkimuksen, opiskelun ja suuren yleisön saataville. DRI:lle on lisäksi heinäkuun alussa myönnetty arvostettu Data Seal of Approval –sertifikaatti, joka myönnetään organisaatioille, jotka säilyttävät sähköisiä aineistoja luotettavasti sekä mahdollistavat niiden jatkokäytön.

Konferenssin osallistujalista oli melko irlantilaisvoittoinen, mutta ilokseni mukaan oli eksynyt myös pohjoismainen kollega, Ruotsin tietoarkiston eli SND:n kieliaineistoista vastaava Caspar Jordan. Myös CSC oli lähettänyt paikalle KDK-PAS-hankkeen (Kansallinen Digitaalinen Kirjasto – Pitkäaikaissäilytys) kehitystyössä mukana olleen it-puolen edustajan. KDK:n perusideahan on hyvin samankaltainen kuin DRI:n, toisin sanoen digitaalisten kulttuuriperintöaineistojen keskitetyn pitkäaikaissäilytyspalvelun suunnittelu ja toteuttaminen.

Konferenssin punaisena lankana toimikin huoli ja vastuu valtavien aineistomassojen säilymisestä ja säilyttämisestä. Kun jo puhtaasti analogista historiallista, taiteellista, yhteiskuntatieteellistä ja kulttuuriperintöön liittyvää aineistoa on valmiina kilometrikaupalla, tuo omat haasteensa nykyinen digitaalinen aika, joka tuottaa jatkuvalla syötöllä valtavia, yli ymmärryksen käyviä aineistomassoja. Osa esityksistä pohdiskelikin erityisesti sitä, miten sovittaa analogiset aineistot digitaalisiin työnkulkuihin. Toisaalta taas osa esityksistä keskittyi nimenomaisesti jatkuvasti tuotettuun digitaaliseen materiaaliin ja sen mielekkääseen säilyttämiseen. Kuinka alati karttuvaa aineistoa (esimerkiksi Facebookissa, Twitterissä, e-lehdissä, jne.) saa talteen sitä vauhtia kuin sitä tuotetaan ja onko kaiken säilyttäminen ylipäätään mielekästä? Nykyisen digitalisoitumisen myötä erilaiset aineistot ovat lisäksi varsin hyvin saatavilla, mutta haasteita luo niiden pitkäaikaissäilytyksen turvaaminen, omistajuuteen niveltyvät kysymykset tai teknisiin ratkaisuihin liittyvät seikat.

Pääosassa olivat aineistot ja sisällöt, paikoin myös teoreettiset lähestymistavat tai aineiston hallinnan kysymykset. Melko monen esityksenpitäjän taustaorganisaatio tai projekti oli sellainen, jossa arkistoinnin lisäksi myös aktiivisesti digitoidaan aineistoja. Erilaisten esimerkkitapausten avulla avattiin sisällöllisiä ja käytännöllisiä ratkaisuja säilyttämiskysymyksiin. Muuan esitys viihdytti yleisöä esittelemällä varhaisen, 1990-lopun online-taideprojektin, The Bono Probability Positioning Systemin, joka toimi eräällä tapaa Google Street View -sovelluksen edeltäjänä. Sen ideana oli liittää erinäisiin Dublinin karttakohteisiin todennäköisyyslaskelma siitä, miten suurella todennäköisyydellä paikassa saattoi törmätä U2-yhtyeen nokkamieheen Bonoon. Projekti oli kieli poskessa luotu ja todennäköisyyslaskelmat täysin hatusta temmattuja. Projekti toimi kuitenkin hyvänä esimerkkinä siitä, millaisia haasteita on pyrkimyksessä säilyttää vanhempaa nettiin luotua digitaalista sisältöä, jota ei alun perin ole ajateltu säilytettäväksi. Perinteisempää ja arkistoalalle tyypillisempiä ongelmia pohdittiin muun muassa esityksissä, jossa esiteltiin arkaluontoiseen aineistoon liittyviä eettisiä ongelmia tai metadatan käsittelyä.

Kodikasta humanistihenkeä ja yhdessä tekemisen ilosanomaa huokunut konferenssi oli leppoisa kokemus, joka kuitenkin tarjosi melko monipuolisen kattauksen digitaalisten aineistojen kirjavaan maailmaan. Konferenssin irlantilaiset järjestäjät toivoivatkin, että DPASSH muodostuisi jokavuotiseksi. Tämän toiveen allekirjoitan mielihyvin.

Lisätietoa:
» DPASSH 2015
» The Digital Repository of Ireland
» The Bono Probability Positioning System

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

Vahvempi ja monipuolisempi

Tietoarkisto on laatinut strategiansa vuosille 2013-2016. Tavoitteisto on aikaisempaa tiiviimpi. Keskeisiä kokonaisuuksia on viisi ja kunkin seurannan tueksi rakennetaan indikaattorit.

Valtakunnallinen neuvottelukuntamme piti asiakirjaa onnistuneena ja niin pidämme mekin täällä tietoarkistossa. Tuulta päin.

Koko nelivuotiskautemme isoin juttu on palvelujemme laajentaminen muille tieteenaloille, etenkin terveystieteisiin, humanistisiin tieteisiin ja käyttäytymistieteisiin. Tähän olemme hakeneet ja haemme lisärahoitusta. Uskomme vakaasti, että olemme Suomen paras sijoituspaikka sentyyppisille tutkimusaineistoille, joita olemme tähänkin mennessä arkistoineet.

Toinen ja kolmas päätavoitteemme ovat palvelujen tehostaminen ja monipuolistaminen. Kuluvan kevään merkkitapaus on aineistojen tilaus- ja toimitusjärjestelmän muuttuminen sähköiseksi. Korkeakoulukäyttäjät voivat pian asioida meillä peruspalvelutunnuksillaan ja muille käyttäjille luodaan rinnakkainen rekisteröitymisjärjestelmä. Aineistojen saatavuus helpottuu.

Käsityksemme on, että ajan mittaan tämä uudistus muuttaa tietoarkistopalvelujen painopistettä. Liikkeestä ovat jo hyviä esimerkkejä tutkimusaineistojen hallintaan eri tavoin liittyvät koulutus- ja tietopalvelut.

Neljänneksi myös kansainvälinen yhteistyömme syvenee merkittävästi tästä vuodesta alkaen. Norjan ja Saksan pääosin rahoittama alamme eurooppalainen tutkimusinfrastruktuuri CESSDA aloittaa ensin yhtiömuotoisena ja muuttuu pian sen jälkeen niin sanotuksi ERIC-toimijaksi. FSD:stä tulee kansallinen palvelutuottaja. Yhteistyön ja palveluvalmiuden rakentaminen työllistävät tietoarkistoa koko nelivuotiskauden.

Toimintamme kasvu ei ole pelkästään omissa käsissämme. Haemme valtakunnalliselle mandaatillemme laajennusta, joka edellyttää neuvotteluja ja lisäresursseja. Tiedämme, että moni muukin tutkimusinfrastruktuuri on jonossa hattu kourassa.

Oma visiomme on vahvempi ja monipuolisempi Suomen tietoarkisto.

Sami Borg
johtaja
etunimi.sukunimi@uta.fi