Datan hankkiminen

OSA I: AVOIN DATA

Suomessa on jo kohtuullisen runsaasti ns. avointa dataa, eli eri tahojen julkaisemia tietokantoja. Avoin data on määritelmänsä mukaan kenen tahansa vapaasti käytettävissä ja edelleen jaettavissa. Datan vapaa saatavuus pitää sisällään vaatimuksen, että datan on oltava kokonaisuudessaan saatavilla ilmaiseksi tai korkeintaan kohtuullista korvausta vastaan mielellään internetin kautta ja helposti käytettävässä, koneluettavassa muodossa.

Lue lisää: Avoin data

OSA II: TIETOPYYNNÖT, JOUKKOISTAMINEN, RAAPIMINEN

Avointen tietokantojen lisäksi dataa voi hankkia eri tavoin, esimerkiksi tietopyyntöjä tekemällä, joukkoistamalla (crowdsourcing) ja netistä ”raapimalla” (scraping). Seuraavilla alasivuilla on johdatusta näihin kolmeen datanhankkimisen tapaan. Tietopyynnön tekeminen kannattaa aloittaa sen selvittämisellä, millaista tietoa on viranomaisilta mahdollista saada. Joukkoistaminen voi merkitä yksinkertaisimmillaan vaikkapa vain pienen kyselyn tekemistä yleisölle ja tulosten julkaisemista taulukkomuodossa. Kunnianhimoisimmissa projekteissa yleisö on kyetty mobilisoimaan mukaan esimerkiksi tutkimaan kansanedustajien kululaskuja (mainitse case). Screen scraping tarkoittaa puolestaan sitä, että verkkosivuilla olevaa tietoa kopioidaan koneluettavaan muotoon ja muunnetaan esimerkiksi taulukoksi.

Lue lisää: Tietopyynnöt

Lue lisää: Joukkoistaminen

Lue lisää: Raapiminen

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *