Tag Archives: tutkimusaineistot

Datapolitiikat ohjaavat avaamaan tutkimusaineistot vastuullisesti

Tampereen yliopisto julkaisi datapolitiikkansa lokakuun lopussa otsikolla Avoin tiede Tampereen yliopistossa: julkaisu- ja datapolitiikka. Asiakirja koskee sähköisiä julkaisuja ja tutkimusdataa. Sekä julkaisupolitiikassa että datapolitiikassa on tavoitteena saada tutkimustieto avoimeksi ja helposti löydettäväksi. Lisäksi politiikkapaperi kertoo, mitä avoimuutta tukevia palveluita yliopistoyhteisön jäsenille on tarjolla.

Tampereen yliopisto ei ole datapolitiikan teossa aivan viimeisenä liikkeellä, mutta turhaa kiirettäkään ei ole pidetty. Osasyynä rauhalliseen tahtiin on voinut olla se, että on ajateltu Tietoarkiston hoitavan homman jo käytännössä.

Erityisesti viimeksi kuluneen vuoden aikana Suomessa on julkaistu useita datapolitiikkoja. Kun Tietoarkiston väistyvä johtaja Sami Borg selvitti toissa syksynä yliopistojen tilannetta, vain Jyväskylän yliopistossa oli ”tutkimuksen tietoaineistojen hallinnan periaatteet”. Nyt näitä periaatteita tai datapolitiikkoja on paitsi useissa ylipistoissa myös muissa organisaatioissa. Myös rahoittajien vaatimukset aineistonhallintasuunnitelmien laatimiseksi ja aineistojen avaamiseksi ilmentävät rahoittajien datapolitiikkoja, olipa erillistä politiikkadokumenttia olemassa tai ei.

Datapolitiikan puuttuminen ei ole onneksi estänyt Tampereen yliopiston tutkijoita tallentamasta aineistoja Tietoarkistoon. Päinvastoin he ovat olleet muiden yliopistojen tutkijoita innokkaampia arkistoijia. Paljon kiinnostavia aineistoja on kuitenkin jäänyt avaamatta, niin Tampereella kuin muissakin tutkimusorganisaatioissa. Niinpä meille tietoarkistolaisille linjaus, jossa suoraan kehotetaan tallentamaan aineistot ensi sijassa Tietoarkistoon, on tervetullut apuväline oman yliopiston aineistojen hankinnassa.

Tampereen yliopiston datapolitiikka lupaa, että Tietoarkisto tukee tutkimusaineistojen vastuullista avaamista ja huolehtii tallennettujen aineistojen pitkäaikaissaatavuudesta. Lisäksi Tietoarkiston luvataan välittävän aineistojen kuvailutiedot useisiin kansallisiin ja kansainvälisiin tietokantoihin. Politiikka viittaa myös Tietoarkiston Aineistonhallinnan käsikirjaan, joka opastaa hyvään datanhallintaan ja tunnisteiden poistoon. Tietoarkisto voi auttaa anonymisoinnissa, kun data tallennetaan Tietoarkistoon.

Tampereen yliopiston lisäksi Tietoarkistolla on ystäviä myös muissa suomalaisissa yliopistoissa. Tämä on käynyt selväksi. Vaikka niiden datapolitiikassa ei mainittaisi Tietoarkistoa, tarkemmassa ohjeistuksessa meihin yleensä jo viitataan, huhujen mukaan suullisessa neuvonnassa vielä useammin. Onkin hyvä muistaa, että Tampereen yliopiston avoimen tieteen linjauksissa mainitut Tietoarkiston palvelut koskevat kaikkien Suomen yliopistojen tutkijoita. Ja toki annamme neuvontaa myös muille mahdollisille asiakkaille ammattikorkeakouluissa ja tutkimuslaitoksissa – kunhan he ovat aikeissa tallentaa aineistojaan Tietoarkistoon.

Palvelulupauksessamme ei ole sinänsä mitään uutta. Tietoarkisto on tarjonnut palveluitaan jo lähes 20 vuotta. Ennen kuin Aineistonhallinnan käsikirja julkaistiin syksyllä 2008, vastaavaa neuvontaa sai asiakaspalvelustamme. Uutta on, että Tampereen yliopisto ja monet muut organisaatiot kehottavat tai jopa vaativat, että aineistot avataan ja suosittelevat juuri Tietoarkiston palveluita.

Toivon, että datapolitiikat eivät ole kuormitetuille tutkijoille vain yksi uusi ahdistava vaatimusten kokoelma. Ne eivät ole ratkaisu ongelmiin, joita tutkijat aineistojen avaamisessa kohtaavat, mutta ne kehottavat vahvasti ryhtymään ratkomaan mahdollisia ongelmia – ja hakemaan apua kokeneilta asiantuntijoilta. Enää aineistoja ei voi jättää avaamatta vain, koska se ei ole ollut tapana.

Tietoarkistolle, yliopistojen kirjastoille ja tutkimuspalveluille – kuka tai ketkä missäkin organisaatiossa käytännön toteuttamisesta vastaavatkaan – datapolitiikkojen julkaiseminen on vasta alkua. Pelkkä datapolitiikka ei muuta vielä mitään, vaan politiikka on jalkautettava, ja siihen me täällä Tampereella ryhdymme nyt.

Jyväskylässä ja Helsingissä datapolitiikan jalkauttamisesta on kokemusta viimeisen parin vuoden ajalta. Asiat edistyvät hitaasti, mutta ne edistyvät. Tietoarkistotyötä nyt noin 15 vuotta tehneenä olen kehityksestä suorastaan innoissani. Aineistojen avaaminen on nykyään kaikkien yhteinen juttu!

Tietoarkisto ja Tampereen yliopiston kirjasto järjestävät 9.11. Tampereella Kesytä aineistokaaos -iltapäiväseminaarin, jossa esittelen lyhyesti juuri julkaistua Tampereen yliopiston datapolitiikkaa. Iltapäivä tarjoaa myös käytännönläheistä tietoa siitä, miten hallita aineistoaan, ja millaisia palveluita tutkijan tueksi on tarjolla.

Lisätietoja
» Tampereen yliopiston julkaisu- ja datapolitiikka
» Avoin tiede ja tutkimus -hanke listaa organisaatioiden linjauksia ja ohjeistuksia
» Kesytä aineistokaaos -seminaari

Helena Laaksonen
informaatikko, varajohtaja
etunimi.sukunimi [at] uta.fi

Aineistopalkitun puhe: "HYPA-aineisto antaa eväitä keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta."

Tutkija Katri Hannikainen-Ingman vastaanotti Tietoarkiston Aineistopalkinnon THL:n tutkimusprofessori Pasi Moision puolesta Aila ja aineistojen jatkokäyttö -seminaarissa Tampereella 15. syyskuuta. Hannikainen-Ingmanin pitämä palkintopuhe oli niin hieno, että Tietoarkisto pyysi luvan julkaista sen blogissa kokonaisuudessansa.

Arvoisat järjestäjät ja hyvä seminaariväki.

Yhteiskuntatieteellisen tietoarkiston Suomalaisten hyvinvointi ja palvelut eli HYPA-tutkimusaineistolle myöntämä Aineistopalkinto on hieno arvostuksen osoitus. Suuri kiitos siitä!

Olemme Sosiaalipolitiikan tutkimusyksikön päällikön tutkimusprofessori Pasi Moision kanssa HYPA-aineiston arkistonhoitajat ja yhteyshenkilöt Terveyden ja hyvinvoinnin laitoksessa. Pasi Moision panos aineiston suunnittelussa ja kehittämisessä on alusta alkaen ollut merkittävä. Myös suuri joukko muita Stakesin ja sittemmin Terveyden ja hyvinvoinnin laitoksen asiantuntijoita on ollut mukana suunnittelemassa ja kehittämässä aineistoa ja saattamassa sitä arkistoitavaksi ja vapaaseen tutkimuskäyttöön.

Jos Suomalaisten hyvinvointi- ja palvelut -kyselylle ja aineiston avoimeen käyttöön saattamiselle täytyisi nimetä isä, hän olisi edesmennyt Stakesin tutkimusprofessori ja pääjohtaja Matti Heikkilä. Hänellä oli selkeä näkemys siitä, että tutkimusaineistojen tulee olla avoimessa käytössä tutkijoiden saatavilla. Vielä 2000-luvun alussa tämä ei ollut niinkään selvää kuin tänä päivänä toistakymmentä vuotta myöhemmin. HYPA-aineisto oli jo tuolloin tarkoitus arkistoida Yhteiskuntatieteelliseen tietoarkistoon, mutta kesti kuitenkin vuosia ennen kuin tilastolain tulkinta muuttui ja HYPA voitiin arkistoida FSD:hen.

Suomalaisten hyvinvointi ja palvelut -kysely on toteutettu neljä kertaa, ensimmäinen vuonna 2004. Kyselyt on suunnattu aikuisväestölle ja niiden rungon ovat muodostaneet puhelinhaastattelut. Haastattelutietoja on täydennetty rekisteritiedoilla sukupuolesta, iästä, perherakenteesta, koulutuksesta, tuloista sekä aluetiedoista. Puhelinhaastattelujen otos muodostuu 18–79-vuotiaista Suomessa vakituisesti asuvista henkilöistä. 80 vuotta täyttäneiltä tiedot on kerätty käyntihaastatteluin. Viimeisessä vuonna 2013 kerätyssä aineistossa puhelinhaastatteluiden otos oli lähes kuusi tuhatta henkilöä ja vastausprosentti reilut 72. 80 vuotta täyttäneillä otos oli kuusisataa henkilöä ja vastausprosentti hieman yli 62.

Koko aikuisväestölle suunnatun kyselyn rinnalla on toteutettu erillisiä lapsiperheille suunnattuja hyvinvointi ja palvelut -postikyselyitä.

HYPA-kysely nykymuodossaan loppuu, mutta sen elämä jatkuu osana Aikuisten terveys- hyvinvointi- ja palvelututkimusta (ATH).

Hallinto ja poliittiset päättäjät tarvitsevat päätöksenteon tueksi tutkittua tietoa. Hyvinvointipolitiikassa tutkimuksen tehtävä on kriittisen ja samalla uskottavan analyysin esittäminen siitä, mikä on hyvinvoinnin ja pahoinvoinnin tila. Samalla on pyrittävä näyttämään, missä määrin politiikka on johtanut hyvään kehitykseen tai ehkäissyt huonoa.

Suomalaisten hyvinvointi ja palvelut -aineistolla tuotetuilla analyyseillä on piirretty kuvaa väestön hyvinvoinnista, palvelujen käytöstä, elämänlaadusta sekä hyvinvointieroista ja niiden kehityksestä 2000-luvulla. HYPA-kyselyillä on saatu myös arvokasta tietoa suomalaisen hyvinvointivaltion kannatusperustasta. Aineisto antaa näin eväitä yhteiskunnalliseen keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta.

HYPA-aineistoilla on tuotettu kirjasarja, jonka viimeisin osa julkaistiin kaksi vuotta sitten. Suomalaisten hyvinvointi 2014 -kirjan 18 artikkelia kertovat toisaalta oikeansuuntaisesta hyvinvointipolitiikasta, sillä väestön hyvinvoinnin ja elämänlaadun todettiin keskimäärin olevan hyvät. Toisaalta kuitenkin hyvinvoinnin eriarvo ja yhteiskunnalliset jaot ovat suomalaista todellisuutta ja niiden on nähty viime vuosina jopa kärjistyneen.

Kun keskustellaan yhteiskunnan kestävästä tulevaisuudesta, on tärkeää kysyä, kuinka suureen sosiaaliseen eriarvoisuuteen meillä on varaa. Viimeisimmän, vuonna 2013, toteutetun HYPA-kyselyn valossa joidenkin väestöryhmien väliset hyvinvoinnin erot ovat selvät, ja eriarvo on kansalaistenkin mielestä liian suuri. Vastaajat kannattivat sen kaltaista kollektiivista solidaarisuutta, jossa huolehditaan koko yhteiskunnan tukipilarien kestävyydestä, mutta pyritään samalla turvaamaan hyvinvointi myös heille, jotka eivät ilman tukea sitä saavuta. Tulevaisuutta rakennettaessa kansalaisten näkemykset ja hyväksyntä poliittisille ratkaisuille on tärkeää.

Lopuksi haluan esittää vielä suuren kiitoksen Yhteiskuntatieteelliselle tietoarkistolle. Yhteistyö on sujunut hienosti ja palvelu on ollut erinomaista. Tietoarkisto on mahdollistanut ja varmistanut HYPA-aineiston avoimen ja helpon tutkimuskäytön nyt ja tulevaisuudessa.

HYPA-aineisto on niin sanotusti päässyt hyvään kotiin! Kiitos!

Lisätietoja
» Aila-seminaarin ohjelma, esitykset ja videot

Katri Hannikainen-Ingman
Terveyden ja hyvinvoiniin laitoksen Sosiaalipolitiikan tutkimusyksikön tutkija

Aineistopalkitun puhe: "HYPA-aineisto antaa eväitä keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta."

Tutkija Katri Hannikainen-Ingman vastaanotti Tietoarkiston Aineistopalkinnon THL:n tutkimusprofessori Pasi Moision puolesta Aila ja aineistojen jatkokäyttö -seminaarissa Tampereella 15. syyskuuta. Hannikainen-Ingmanin pitämä palkintopuhe oli niin hieno, että Tietoarkisto pyysi luvan julkaista sen blogissa kokonaisuudessansa.

Arvoisat järjestäjät ja hyvä seminaariväki.

Yhteiskuntatieteellisen tietoarkiston Suomalaisten hyvinvointi ja palvelut eli HYPA-tutkimusaineistolle myöntämä Aineistopalkinto on hieno arvostuksen osoitus. Suuri kiitos siitä!

Olemme Sosiaalipolitiikan tutkimusyksikön päällikön tutkimusprofessori Pasi Moision kanssa HYPA-aineiston arkistonhoitajat ja yhteyshenkilöt Terveyden ja hyvinvoinnin laitoksessa. Pasi Moision panos aineiston suunnittelussa ja kehittämisessä on alusta alkaen ollut merkittävä. Myös suuri joukko muita Stakesin ja sittemmin Terveyden ja hyvinvoinnin laitoksen asiantuntijoita on ollut mukana suunnittelemassa ja kehittämässä aineistoa ja saattamassa sitä arkistoitavaksi ja vapaaseen tutkimuskäyttöön.

Jos Suomalaisten hyvinvointi- ja palvelut -kyselylle ja aineiston avoimeen käyttöön saattamiselle täytyisi nimetä isä, hän olisi edesmennyt Stakesin tutkimusprofessori ja pääjohtaja Matti Heikkilä. Hänellä oli selkeä näkemys siitä, että tutkimusaineistojen tulee olla avoimessa käytössä tutkijoiden saatavilla. Vielä 2000-luvun alussa tämä ei ollut niinkään selvää kuin tänä päivänä toistakymmentä vuotta myöhemmin. HYPA-aineisto oli jo tuolloin tarkoitus arkistoida Yhteiskuntatieteelliseen tietoarkistoon, mutta kesti kuitenkin vuosia ennen kuin tilastolain tulkinta muuttui ja HYPA voitiin arkistoida FSD:hen.

Suomalaisten hyvinvointi ja palvelut -kysely on toteutettu neljä kertaa, ensimmäinen vuonna 2004. Kyselyt on suunnattu aikuisväestölle ja niiden rungon ovat muodostaneet puhelinhaastattelut. Haastattelutietoja on täydennetty rekisteritiedoilla sukupuolesta, iästä, perherakenteesta, koulutuksesta, tuloista sekä aluetiedoista. Puhelinhaastattelujen otos muodostuu 18–79-vuotiaista Suomessa vakituisesti asuvista henkilöistä. 80 vuotta täyttäneiltä tiedot on kerätty käyntihaastatteluin. Viimeisessä vuonna 2013 kerätyssä aineistossa puhelinhaastatteluiden otos oli lähes kuusi tuhatta henkilöä ja vastausprosentti reilut 72. 80 vuotta täyttäneillä otos oli kuusisataa henkilöä ja vastausprosentti hieman yli 62.

Koko aikuisväestölle suunnatun kyselyn rinnalla on toteutettu erillisiä lapsiperheille suunnattuja hyvinvointi ja palvelut -postikyselyitä.

HYPA-kysely nykymuodossaan loppuu, mutta sen elämä jatkuu osana Aikuisten terveys- hyvinvointi- ja palvelututkimusta (ATH).

Hallinto ja poliittiset päättäjät tarvitsevat päätöksenteon tueksi tutkittua tietoa. Hyvinvointipolitiikassa tutkimuksen tehtävä on kriittisen ja samalla uskottavan analyysin esittäminen siitä, mikä on hyvinvoinnin ja pahoinvoinnin tila. Samalla on pyrittävä näyttämään, missä määrin politiikka on johtanut hyvään kehitykseen tai ehkäissyt huonoa.

Suomalaisten hyvinvointi ja palvelut -aineistolla tuotetuilla analyyseillä on piirretty kuvaa väestön hyvinvoinnista, palvelujen käytöstä, elämänlaadusta sekä hyvinvointieroista ja niiden kehityksestä 2000-luvulla. HYPA-kyselyillä on saatu myös arvokasta tietoa suomalaisen hyvinvointivaltion kannatusperustasta. Aineisto antaa näin eväitä yhteiskunnalliseen keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta.

HYPA-aineistoilla on tuotettu kirjasarja, jonka viimeisin osa julkaistiin kaksi vuotta sitten. Suomalaisten hyvinvointi 2014 -kirjan 18 artikkelia kertovat toisaalta oikeansuuntaisesta hyvinvointipolitiikasta, sillä väestön hyvinvoinnin ja elämänlaadun todettiin keskimäärin olevan hyvät. Toisaalta kuitenkin hyvinvoinnin eriarvo ja yhteiskunnalliset jaot ovat suomalaista todellisuutta ja niiden on nähty viime vuosina jopa kärjistyneen.

Kun keskustellaan yhteiskunnan kestävästä tulevaisuudesta, on tärkeää kysyä, kuinka suureen sosiaaliseen eriarvoisuuteen meillä on varaa. Viimeisimmän, vuonna 2013, toteutetun HYPA-kyselyn valossa joidenkin väestöryhmien väliset hyvinvoinnin erot ovat selvät, ja eriarvo on kansalaistenkin mielestä liian suuri. Vastaajat kannattivat sen kaltaista kollektiivista solidaarisuutta, jossa huolehditaan koko yhteiskunnan tukipilarien kestävyydestä, mutta pyritään samalla turvaamaan hyvinvointi myös heille, jotka eivät ilman tukea sitä saavuta. Tulevaisuutta rakennettaessa kansalaisten näkemykset ja hyväksyntä poliittisille ratkaisuille on tärkeää.

Lopuksi haluan esittää vielä suuren kiitoksen Yhteiskuntatieteelliselle tietoarkistolle. Yhteistyö on sujunut hienosti ja palvelu on ollut erinomaista. Tietoarkisto on mahdollistanut ja varmistanut HYPA-aineiston avoimen ja helpon tutkimuskäytön nyt ja tulevaisuudessa.

HYPA-aineisto on niin sanotusti päässyt hyvään kotiin! Kiitos!

Lisätietoja
» Aila-seminaarin ohjelma, esitykset ja videot

Katri Hannikainen-Ingman
Terveyden ja hyvinvoiniin laitoksen Sosiaalipolitiikan tutkimusyksikön tutkija

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.

Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.

Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.

Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

Data Service Portal Aila: accessibility and practicality for non-Finnish speakers

The Finnish Social Science Data Archive (FSD) is one of the most important national resources for the collection and storing of social research data. Among the many services they offer, they aim to make research data available to everyone, free of char…

Data Service Portal Aila: accessibility and practicality for non-Finnish speakers

The Finnish Social Science Data Archive (FSD) is one of the most important national resources for the collection and storing of social research data. Among the many services they offer, they aim to make research data available to everyone, free of char…

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Miten aineistot arkistoituvat Tietoarkistoon?

Kun tutkija tai tutkijaryhmä on lähettänyt tutkimusaineistonsa Tietoarkistoon arkistoitavaksi, varsinainen aineiston käsittelyprosessi vasta alkaa. Arkistoitavaksi toimitettu aineisto kulkee aina aineistonkäsittelijän sormien läpi ennen kuin se julkaistaan palveluportaali Ailassa jatkokäyttöä varten.

Erilaiset tietokoneohjelmat helpottavat, nopeuttavat ja virtaviivaistavat aineiston käsittelyä, mutta loppujen lopuksi aineiston käsittelyyn liittyvän työn tekevät ihmiset eivätkä koneet. Näin pystymme varmistamaan, että mitä moninaisimmat aineistot ovat tulevaisuudessakin tutkimusmaailman käytettävissä yhdenmukaiseksi suunniteltujen ohjeidemme mukaisesti.

Aineistonkäsittelijäntyö on Tietoarkiston ydintyötä, jota ilman Ailassa ei olisi jatkokäyttökelpoisia aineistoja. Tietoarkiston pitkäaikaiset tutkimusapulaiset Eliisa Haanpää (kvantitatiivisten aineistojen käsittely) ja Annika Sallinen (kvalitatiivisten aineistojen käsittely) kertovat, minkälaista aineistonkäsittelijän työ on, ja minkälaisen prosessin aineistot käyvät läpi ennen kuin ne ilmestyvät Ailaan.

Kyselytutkimukset arkistoituvat muuttuja muuttujalta

Eliisa

Aloitan kvantitatiivisen aineiston käsittelyn aina tutustumalla aineistoon, siihen sisältyviin muuttujiin sekä aineistoon liittyvään tutkimusraporttiin ja lisämateriaaliin. Avattuani datatiedoston, tarkastan ensimmäisenä kaikki muuttujat ja varmistan, että käsiteltävä data vastaa kyselylomaketta. Nimeän muuttujat kyselylomakkeen mukaisesti, mihin perustuen määrittelen myös muuttujien selitteet.

Tämän jälkeen arvioin aineiston tunnisteellisuutta ja arkaluontoisuutta, jonka jälkeen teen tarvittavat toimet vastaajien anonymiteetin säilyttämiseksi. Tässä vaiheessa apunani ovat usein Tilastokeskuksen erilaiset alue-, toimiala- ja tieteenalaluokitukset. Lopuksi vielä varsinaista dataa käsitellessäni tarkistan muuttujien frekvenssit suhteessa tutkimusraporttiin.

Käsittelen dataa SPSS:n syntaksin avulla. Numeroista ja loogisesta päättelystä pitävänä ihmisenä syntaksin työstäminen on mielestäni palkitsevaa puuhaa. Syntaksin tekemiseen sisältyy monia yksin ja yhdessä kollegojen kanssa pohdittavia haasteita, useita onnistumisen kokemuksia, kun komennot toimivat toivomallani tavalla ja tietysti työni kannalta tärkein tuotos, jatkokäyttöön valmistuva datatiedosto.

Varsinaisen datan valmistuttua siirryn aineiston kuvailuun, johon kuuluu muuttujien kuvailu sekä aineiston sisällöllinen kuvailu. Tietopankkina sisällöllistä kuvailua tehdessäni käytän tutkimusraporttia ja sieltä löytyviä aineistonkeruuseen liittyviä tietoja. Aineiston (eli datan sekä aineiston kuvailun) käsittelyn valmistuttua kirjaan tietokantaamme ”data valmis”-komennon, jonka jälkeen aineisto julkaistaan palveluportaali Ailassa.

Aineistoja käsitellessäni olen oppinut paljon paitsi tilastollisista menetelmistä ja kyselytutkimuksista, myös eri tieteenalojen tutkimusteemoista. Olen tähän mennessä käsitellyt aineistoja liittyen muun muassa lasten ja nuorten mediakäyttäytymiseen, lasten uhrikokemuksiin, suomalaisten hyvinvointiin, eduskuntavaaleihin, asumiseen ja kaupunkikuvaan, opiskeluun sekä vapaaehtoistoimintaan.

Aineiston käsittelyn eri vaiheissa olen yhteydessä yhteen tai useampaan tutkijaan, mikäli tarvitsen aineistosta lisätietoja. Yhteistyö sekä tutkijoiden suuntaan että kollegoiden kanssa on erittäin merkittävässä osassa työskentelyssäni aineistojen parissa.

Kvalitatiivisessa aineistossa tallentuu aina pala aikaa

Annika

Kvalitatiivisten aineistojen arkistointi poikkeaa kvantitatiivisten aineistojen arkistoinnista sikäli, ettei siinä tarvitse pohtia syntaksin komentoja, mutta lukulihaksia työ vaatii senkin edestä. Luemme tänne toimitetuista haastatteluista ja kirjoituksista jokaisen sivun. Tämä täytyy tehdä huolellisesti, että ihmisten tunnistetietoja ei jää luovutettavaan aineistoon. Tekstimassaa saattaa olla yhdessä aineistossa jopa lähes tuhat sivua.

Kvalitatiivisten aineistojen tarkastaminen on siis välillä uppoutumista lukemiseen, mutta työ sisältää myös järjestelmällistä tiedon poimimista sekä järjestelyä ja tietokoneohjelmien kanssa kikkailua – mikä on aina oma taiteenlajinsa.

Dokumentit nimetään järjestelmällisesti. Aineistojen taustatiedot järjestetään yhdenmukaisiksi ja niistä tehdään taustatietohakemisto jatkokäyttäjälle. Työssä käytetään lukuisia ohjelmia, joista tekninen palvelu keskustelee mm. termeillä DDI, HTML ja Python – minä keskityn opettelemaan konkreettisen käytön.

Koko arkistointiprosessin ajan teen muistiinpanoja eteen tulleista ongelmakohdista, niiden ratkaisuista ja vielä tehtävistä vaiheista. Listalla voi olla selvitettävänä, mitä tutkijan kryptinen merkintä muistiinpanoissa tarkoittaa, mihin teollisuusalaan karkeistetaan Suomussalmen Hallan lihajalostamo, sisältävätkö dokumentit piilodataa ja saisiko 400 erillisen tiedoston nimet muutettua automaattisesti toiseen muotoon, jotta kaikkea ei tarvitsisi tehdä käsin.

Kaikkeen löytyy yleensä vastaus, joko kollegoilta, tutkijoilta tai yhdeltä tärkeältä työkaverilta – internetistä. Netti on ollut oiva apu esimerkiksi tilanteessa, jossa oman pään kapasiteetti keksiä suomalaista naisten nimiä on tullut tiensä päätökseen.

Minun mielestäni kvalitatiivisten aineistojen arkistointi on erittäin mielenkiintoista, sillä tutkimusaineistoon perehtyminen on aina oma matkansa jonkin tieteenalan ja alueen tutkimuksen pariin. Aineistoja läpi kahlatessa oppii uusia käsitteitä ja ymmärtää taas elämää eri näkökulmista ehkä hitusen paremmin. Tutkittavat kertovat tutkijalle elämästään asioita, joita eivät muille välttämättä kerro. Työ sisältää myös varjopuolia. Koska kaikki työvaiheet vaativat tarkkuutta ja keskittymistä, silmien ja lukuhermojen ajoittaiselta väsymisiltä ei voi välttyä.

Arkistoinnin loppusuoralla kirjoitetaan vielä nettisivuille tuleva kuvaus aineistosta ja hiotaan aineiston yksityiskohtia. Esimerkiksi taustatietoihin tulee helposti virheitä. Minun tulee myös tarkastaa, että aineistoon on liitetty mukaan tutkimuskutsut, haastattelukysymykset ja muut tarvittavat dokumentit. Lisäksi haastattelukysymykset tulee tallentaa Aila-hakuun. Julkaisun jälkeen menen vielä nettisivuille katsomaan, että aineisto näyttää siellä siltä, miltä sen pitääkin!

Lisätietoa:
» Palveluportaali Aila

Annika Sallinen, tutkimusapulainen, etunimi.sukunimi [at] uta.fi
Eliisa Haanpää, tutkimusapulainen, etunimi.sukunimi [at] uta.fi

Datan lisäksi Tietoarkisto jakaa osaamista

Tietoarkisto on yksi avoimen tieteen keskeisistä toimijoista Suomessa. Tavoitteenamme on tuottaa tehokkaasti laadukkaita, luotettavia ja helposti saavutettavia data- ja aineistonhallintapalveluja tiedeyhteisölle. Ei mikään läpihuutojuttu. Pitää olla valmiuksia luoda uutta ja omata ajantasaista asiantuntemusta tutkimuksesta, menetelmistä, ohjelmistoista, tutkimusetiikasta, lainsäädännöstä, metadatasta, sähköisestä säilyttämisestä, tietoturvasta ja asiakaspalvelusta – vain muutamia mainitakseni. Niinpä tietoarkistolaisille on kertynyt ainutlaatuista asiantuntemusta monilta eri osa-alueilta. Monimutkaistuvassa maailmassa kellään ei kuitenkaan yksin voi olla kaikkea tarvittavaa osaamista. Tarvitsemme eri alojen asiantuntijoiden tiimejä ja organisaatioiden välistä yhteistyötä.

Aikaisemmin olen kirjoittanut Tietoarkiston aktiivisesta roolista eurooppalaisessa data-arkistotoiminnassa. Olemme laajasti mukana myös kotimaisissa avoimeen tieteeseen sekä aineistojen jakamiseen ja säilyttämiseen liittyvissä aloitteissa. Sekä kansallisissa että kansainvälisissä ympyröissä käytännön työ tehdään yleensä erilaisissa työryhmissä. Osaamisen ja tiedon jakaminen on työn onnistumisen tärkeimpiä edellytyksiä.

Laskin, että tällä hetkellä Tietoarkisto osallistuu 15 erilaiseen kansalliseen ohjaus-, asiantuntija- tai työryhmään. Vuodessa osallistumme niiden tiimoilta keskimäärin noin 70 kokoukseen. Aikaa kokouksiin ja niihin liittyviin tehtäviin kuluu noin kuusi henkilötyökuukautta vuodessa – enemmänkin, jos tietoarkistolaisilla on työryhmissä vetovastuuta. Luvuissa ovat mukana vain sellaiset ryhmät, joihin osallistumme osana perustyötä, eli joihin meillä ei ole erikseen hankerahoitusta.

Työryhmistä monet liittyvät Avoin tiede ja tutkimus (ATT) -hankkeeseen. Tietoarkisto tekee työtä ATT:n asiantuntijaryhmässä, palvelutyöryhmässä, PAS-työryhmässä, kansainvälisyystyöryhmässä, Tuuli-projektissa ja ATT:n ja Kansallisen digitaalisen kirjaston (KDK) yhteisessä oikeuksien metatiedot -työryhmässä. Olemme edustettuina myös KDK:n ohjausryhmässä, tietoarkkitehtuuriryhmässä ja PAS-yhteistyöryhmässä. Muista ryhmistä mainittakoon JHS Rekisterimeta -työryhmä, Tilastokeskuksen etäkäyttöjärjestelmän ohjausryhmä, TUHA-tutkimusaineistoryhmä ja Veteraanikansanedustajien muistitietoarkiston kehittämisryhmä.

Edellä mainitut ryhmät rakentavat hyviä yhteisiä käytäntöjä, standardeja ja erilaisia palveluita tiedeyhteisölle ja laajemminkin. Itse olen mukana useissa ryhmissä ja koen ne antoisina, vaikka turhautumisen hetkiäkin tulee. Välillä tuntuu, että työryhmä toisensa jälkeen puhuu samasta asiasta ja edistyminen on tuskallisen hidasta. Tampere-Helsinki–junamatka on tullut liiankin tutuksi.

Omalla kohdallani turhautuminen on onneksi useimmiten hetkellistä. Tutkimusdatan arkistointi ja avaaminen on suuri muutos tutkimuskulttuurissa, ja sähköinen säilyttäminen muuttaa arkistomaailmaa. Valtionhallinnon digitalisaation yhteydessä puolestaan tavoitellaan siilojen purkamista. Ajattelenkin, että päällekkäisiltä tuntuvat työryhmät heijastelevat näitä käynnissä olevia suuria toimintakulttuurimuutoksia ja jopa kuuluvat murrosvaiheeseen. Tämä ei tarkoita, etteikö työryhmissä ja niiden välisessä työnjaossa olisi tehostamisen tai selkeyttämisen varaa, mutta odotan tilanteen kohenevan ATT:n kaltaisten hankkeiden myötä. Jos jotain saisi toivoa, niin sitä, että alan toimijoilla olisi hieman enemmän kykyä ja mahdollisuuksia (eli käytännössä resursseja) nähdä omia lyhyen tähtäimen etujaan ja intressejään pidemmälle.

Tietoarkisto on vuosien mittaan ollut aktiivinen tiedon ja osaamisen jakaja. Olemme osallistuneet lukuisiin työryhmiin ja hankkeisiin. Kaiken kaikkiaan ne ovat olleet oivallisia tilaisuuksia reflektoida Tietoarkiston käytäntöjä, oppia muilta, ratkaista yhteisiä ongelmia ja jakaa Tietoarkistoon kertynyttä erikoisosaamista. Olemme myös oppineet, että joskus täytyy sanoa ei. Parhaimmillaan ryhmät ovat kuitenkin asiantuntijoiden ja organisaatioiden verkostoja, joissa erilaiset näkökulmat kohtaavat tarjoten pohjan uutta osaamista ja uusia palveluita luovalle yhteistyölle.

Lisätietoja
» Avoin tiede ja tutkimus -hanke (ATT)
» Kansallinen digitaalinen kirjasto (KDK)

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] uta.fi