Avoin data ja avoimet sisällöt – museoille uusi mahdollisuus vai uusi menoerä?

Kimmo Levä esitteli taustalla vireillä olevia asioita: tekijänoikeuslakia ollaan uudistamassa ja uudistettu laki voi tuoda jotain helpotusta datan avaamiseen. Henkilötietolaki kannattaa muistaa: jos tietokanta sisältää henkilötietoja, joiden avulla henkilöitä on tunnistettavissa, tarvitaan lupa julkaisemiselle. Tämä koskee myös kuolleita ja heidän lähipiiriään.

Miksi julkaista:

  • kokoelmat ovat käyttöä varten, joten on järkevää edistää kokoelmien käyttöä eri tavoin
  • museokokoelmat ovat lähtökohtaisesti julkiset
  • asiakas on verkossa ja ”vain verkkomateriaali on olemassa”
  • museoita rahoitetaan merkittävästi yhteisistä varoista.

Taloudelliset mahdollisuudet ja menoerät

Datan avaaminen sisältää erilaisia potentiaalisesti positiivisia seurauksia: yhteiskunnallisen läpinäkyvyyden lisääntymisen lisäksi datan avaaminen tuo hyvää karmaa organisaatioille. Julkisin varoin tuotetun datan avaaminen on lähtökohtaisesti hyvä teko organisaatiolta. Säästöihin voi aueta mahdollisuuksia, mikäli dataa hyödynnetään tai jalostetaan joukkoistamisen kautta.

Potentiaalisia menoeriä ovat tekijänoikeusriski, mikä voi realisoitua, jos avattu data sisältää tekijänoikeuden suojaamaa materiaalia. Datan avaaminen todennäköisesti tuo muassaan uusia työtehtäviä ja lisää työn määrää organisaatiossa.

Avoimen datan ansaintalogiikka

Levän mukaan kestävää on se, että asiakas maksaa jotain. Käytännössä tämä voisi mennä kuvatietokantojen osalta niin, että julkaistaan metadata avoimena ja otetaan maksu varsinaisesta kuvasta. Avoimen datan positiivisista yhteiskunnallisista vaikutuksista puhutaan. Miten saadaan tasattua yhteiskunnan saamat lisätulot avoimesta datasta ja organisaatioille koituvat menot avoimesta datasta, jos esimerkiksi museolle datan avaus maksaa X euroa ja yhteiskunta saa tuloja X euroa?

 

Avoimen datan mahdollisuuksista museossa

Kimmo Antila (Postimuseo) kysyi puheessaan käyttäjyyden ja datan hyödyntämisen perään. Datan avaamisessa(kin) pitäisi miettiä käyttäjyyttä eli kenelle näitä juttuja tehdään. Hyvä kysymys, onko avoin data itseisarvo vai itseasiassa kontekstuaalinen, kuratoitu tieto? Antila korosti kuratoinnin ja analysoinnin tärkeyttä. Datan avaamisen lisäksi organisaation pitäisi analysoida ja tulkita dataa.

Kokeiluja voi tehdä jo olemassa olevilla avoimeen dataan pohjautuvilla työkaluilla. Esimerkiksi Mediawikiä ja Wikipediaa voidaan hyödyntää erilaisten tietovarantojen ja oman osaamisen esilletuonnissa. Näin esimerkiksi tehtiin Rupriikin järjestämässä wiki-työpajassa 9.11.2013.

Tärkeää olisi näyttelyjen ohessa lisätä/parantaa jo olemassa tietoa: kun kokoelmia tuodaan esiin, olisi hyvä pyrkiä samalla lisäämään tietoa ko. aiheesta. Erilainen tutkijayhteistyö näyttelyiden osalta on tärkeää; tästä oli kyse esimerkiksi Inventing Europe -hankkeessa. Joukkoistamista datan rikastamisessa on tutkinut Ari Häyrinen väitöskirjassaan Open sourcing digital heritage : digital surrogates, museums and knowledge management in the age of open networks.

Kimmo Antila asetti datan avauksen hienoksi tavoitteeksi synnyttää uutta luovaa, vuorovaikutteista ja kaikkia osapuolia hyödyttävää tietoa.

Kokemuksia kokoelmadatan avaamisesta Valtion taidemuseossa

Sanna Hirvonen kertoi Valtion taidemuseon datanavausprosessista. Avauksen kohteena oli kolmen museon hallinnoimien taideteosten metadata. Lisenssinä oli CC0 ja tiedot tulivat Muusa-järjestelmästä. Avauksesta on myös Piia Laitan tiedote Data on auki. Datan avaamisen toivotaan tarjoavan uusia kosketuspintoja ja näkökulmia sisältöihin.

Data on tarjolla sekä rajapinnan kautta että datapakettina (DC-XML-, DC-JSON- ja DC-TEXT-muodossa. API-konsolilla voi testata rajapinnan toimintaa. Muusassa data on rakenteistettu Lightweight Information Describing Objects (LIDO) -skeeman mukaisesti, mutta datadumpit on myllytetty Dublin Core -formaattiin. Syynä tähän on ilmeisesti se, että DC on LIDOa yleisempi.

Datan avauksen työvaiheita olivat

  1. päätös avaamisesta
  2. rajapinnan toteutus, jonka teki Grip Studios Interactive
  3. tiedottaminen ja tiedon jakaminen
  4. ideoiden ja palautteen kerääminen käyttäjiltä. Tätä varten Kiasma järjesti data-työpajan 23.10.2013.

Työpajassa ideoitiin muun muassa mihin museodataa voisi yhdistää. Tarjokkaiksi nousivat muun muassa paikkatieto, aikatieto ja kirjastodata.

Työpajassa esitettiin myös hyviä kysymyksiä: Miten tuoda esiin dataa hyödyntävät sovellukset? Miten vastataan kehittämisehdotuksiin? Miten käyttäjien tuottamaa rikastavaa  dataa hyödynnetään ja liitetäänkö tämä rikaste osaksi ns. master-dataa eli tässä tapauksessa osaksi Muusassa olevaa metadataa? Oman datan käyttöä kannattaa seurata ja millaisia dataa hyödyntäviä sovelluksia syntyy.

Seuraavaksi dataa avanneilla museoilla on työn alla kerätä esimerkkejä datan hyödyntämisestä, virittää yhteistyötä muiden tiedontarjoajien kanssa, kehittää tarjolla olevaa dataa saatujen kokemusten ja palautteen pohjalta ja edetä pilottiprojektien kautta kohti avoimempaa lisenssiä.

Mitä on opittu? Ei kannata odottaa, että maailma on valmis. Sama nousi esiin Sanna Marttilan puheenvuorossakin. Datan ei tarvitse olla 100 % oikeaa ja virheetöntä. ”Likainen data” kelpaa sekin, jos muuta ei ole. Yhteistyöhön kannattaa hakeutua varhain mahdollisten käyttäjien kanssa. Kaikkea ei tarvitse osata itse: neuvoa voi kysyä eri foorumilta tai ostaa palveluja.

Museot ja avoin data -seminaaripäivästä

Museoliitto järjesti lokakuun 2013 lopulla seminaarin avoimesta datasta: Avoin data ja avoimet sisällöt museossa. Päivän aikana tehtiin aina tarpeellista käsitteiden määrittelyä (mitä on avoin data, avoin tieto, avoin sisältö ja avoimet palvelut) ja käytiin datan avausta esimerkkien kautta läpi. Hyvä päivä, hyviä esityksiä. Päivästä bloggasi aiemmin Kaisa Kyläkoski: Avoimesti saatua tietoa museoiden keskustelusta avoimuudesta. Kannattaa käydä lukemassa.

Hami Kekkonen kertoi Helsinki Region Infoshare -hankkeesta, jossa suomalaisittain pioneerihengessä haettu julkaistavaksi soveltuvaa dataa pääkaupunkiseudun julkishallinnolta. HRI:n pilottivaihe kesti 2010–2012 ja nyt vuosi 2013 on mennyt avoimen datan ja datan julkaisemisen vakiinnuttamisessa. Kekkosen mukaan pääkaupunkiseudulla datan avaamisesta tulee kuntien normaalia toimintaa vuoden 2014 aikana. Toimintaa ollaan siirtämässä Helsingin kaupungin tietokeskukseen.

Kuntien teknologisten valintojen tekemiseen HRI ei osallistu. Kunnat päättävät itse teknologioistaan esimerkiksi millaisia rajapintoja järjestelmiin rakennetaan.

Päivän esityksistä on tulossa muutamia merkintöjäni seuraavassa tahdissa: