Avoin tieto kirjastojen, arkistojen ja museoiden mahdollisuutena

Kulttuuriasiainneuvos Minna Karvonen kävi esityksessään läpi muistiorganisaatioihin liittyviä avoin data -asioita. Hallitusohjelmassa on monia kytköksiä avoimeen dataan, jotka liippaavat myös muistiorganisaatioita.

Karvonen esitteli Opetus- ja kulttuuriministeriön OKM-KIDE-älystrategiaa. Strategia on tehty vuosille 2013–2016, ja se koostuu kahdesta tavoitekokonaisuudesta

  1. osaamisen ja osallisuuden lisääminen
  2. digitaalisten sisältöjen ja palvelujen kehittäminen muun muassa käyttäjälähtöisyyden ja saavutettavuuden näkökulmasta.

Käytännön toimenpiteitä ovat Museoviraston Museo 2015 ja Kansalliskirjaston KDK ja Melinda, CSC:n Tutkimuksen tietoaineistot (TTA), Avoin-hankkeen ja AVAA-projektin muodostama hanketripla. Näissä projekteissa rakennetaan avoimen datan infrastruktuuria.

Osaamispuolella OKM kiinnittää huomiota tietovarantoihin liittyvän laajapohjaiseen osaamiseen ja media- ja informaatiolukutaitoon. Tarkoitus on myös vahvistaa kulttuurisektorin organisaatioiden ja käyttäjien yhteistyötä.

Karvosella oli esityksessään 5 kysymystä, jotka ovat olennaisia avoimen tiedon hyödynnettävyyden kannalta

  1. koneluettavuus?
  2. maksuttomuus?
  3. vapaasti käytettävissä?
  4. helpposaatavuus?
  5. saako tolkun? Kirjastopuolella tämä tarkoittaisi MARC 21 -formaatin ”suomentamista” alan ulkopuolisille toimijoille, jotka haluaisivat hyödyntää dataa.

Yleisökysymyksessä kysyttiin OKM:n kantaa PSI-direktiiviin. Direktiivi on käytössä ja sitä on sovellettava kansallisesti. Juristiarmeija miettii ainakin vuoden 2013, miten sovellettaisiin ja miten direktiivi implementoidaan meillä. Iso muutos verrattuna aiempaan vastaavaan direktiiviin vuodelta 2003 on, että PSI-direktiivi koskee muistiorganisaatioita ja että se ei koske tekijänoikeuden alaista aineistoa. PSI:ssä on loivennuksia muistiorganisaatioiden kohdalla.

Avoimen tiedon ohjelma 2013 – 2015

Valtiovarainministeriön Anne Kauhanen-Simanainen esitteli ministeriön avoimen tiedon ohjelmaa. Avoimella tiedolla on pitkä historia: juuria löytyy julkisuusperiaatteesta 1700-luvulta. Vuonna 1766 tulivat julkisuuslaki, sanan ja painovapaus jne.

Avoin tieto on noussut hallitusohjelman kärkihankkeeksi. Dataa on avattava kansalaisten ja yritysten käyttöön, ja julkishallinnossa onkin tehty linjauksia ja toimenpiteitä datan avaamiseksi. Taustalla on big data -ajattelu eli massiiviset määrät raakadataa, josta tiedonlouhinnan menetelmin tehdään esimerkiksi analyysia ja ennusteita.

Julkishallinnosta ollaan leipomassa katalysaattoria avoimen datan julkaisemiselle ja hyödyntämiselle. Tähän suuntaan on johdattelemassa muun muassa ICT 2015 -työryhmän 21 kehityspolkua -ehdotukset.

Datan avausta perustellaan muun muassa sillä, että on kansantaloudellisesti järkevää hyödyntää julkisin varoin tuotettua dataa mahdollisimman paljon. Datan avaamisen kerrotaan myös lisäävän läpinäkyvyyttä ja demokratiaa, tehostavan hallintoa, monipuolistavan koulutuksen ja tutkimuksen aineistoja. Hyödyt avaamisesta ovat suuremmat kuin kustannukset.

Esimerkkejä arkea helpottavista ja hallinnonalojen rajat ylittävistä palveluista on muun muassa:

Valtiovarainministeriön Avoimen tiedon ohjelmassa 2013–2015 kehitetään datan avauskäytäntöjä siten, että tietovarantojen avaamisesta tulee osa hallinnon normaalia toimintaa ja että datan avoimuus huomioidaan jo tietojärjestelmiä suunniteltaessa ja hankittaessa.

JulkICT-toiminto-sivusto kertoo, että ohjelmassa toteutetaan myös julkishallinnon tietovarantojen löytämistä ja hyödyntämistä helpottava kansallinen avoimen datan alusta, ns. ”dataportaali” ja avoimeen dataan perustuvien palvelujen kehittämisympäristö JulkICTLab.

Yhteistyöverkostosta tavoitellaan laajaa: mukaan halutaan kansalaiset, yritykset, organisaatiot ja julkinen sektori. Ministeriöt vievät asiaa eteenpäin eri ohjelmissaan.

Onko avoin data uusi selviämistarina? Ministeriö näkee avoimen datan samantapaisena kehitysaskeleena kuin  vaikkapa lukutaidon 1900-luvulla ja jälleenrakentamiskauden 1950-luvulla, jolloin puunjalostusteollisuus oli kehityksen kärjessä. Paljon odotuksia avoimuudelle.

SPARQLaamisesta ja KBARTista

anderoche, SPARKLES! https://www.flickr.com/photos/anderoche/5691737246/sizes/l/
anderoche, SPARKLES! https://www.flickr.com/photos/anderoche/5691737246/sizes/l/

Osallistuin Kirjastoverkkopäiville 23.–24.10.2013. Parin seuraavan bloggauksessa muistiinpanojani päiviltä.

Ensimmäisenä päivänä ehdin iltapäivän Sini Pessalan vetämään SPARQL-työpajasessioon, joka olikin täyden kympin työpaja. Toivottavasti tämän tapaisia hands on -työleirejä järjestetään jatkossakin. Vaikka SPARQL-syvällisyyksiä en valitettavasti kyennyt sisäistämään juuri tällä istunnolla, avautui kyselykieli huomattavasti paremmin kun sitä käpisteli omin käsin.

Magaly Bascones esitteli Knowledge Bases and Related Tools (KBART) -työryhmän tuloksia. KBART on selvittänyt datan tuottamis- ja välitysprosesseja OpenURL-linkityspalveluympäristössä. Mukana työssä on ollut yliopistoja, järjestelmätoimittajia (esimerkiksi OCLC) ja sisällöntuottajia (esimerkiksi Springer). Työn tuloksena on syntynyt muun muassa suosituksia, kuinka kehittää tuossa ympäristössä datan välitysprosesseja. Metadatan vaihtoformaatti sopiminen on yksi näistä saavutuksista.

Datan hyödynnettävyyden edellytyksenä on ilmeisen datan oikeellisuuden lisäksi datan oikea-aikaisuus. Työprosesseja hiotaan, jotta kirjastossa minimoitaisiin datan muokkaukseen ja virheiden korjaamiseen menevä aika. Nyt on menossa hankkeen kakkosvaihe, jossa pohditaan miten ilmaistaan sisältöjen mahdollinen avoin saatavuus. E-kirjojen saatavuustiedot ovat toinen pohdinnan paikka; saatavuustieto ei ole täydellistä eikä standardia.

[schema type=”event” evtype=”Event” url=”http://www.kansalliskirjasto.fi/kirjastoala/tapahtumat/1353590305481.html” name=”Kirjastoverkkopäivät 2013″ description=”Tämänkertaisilla Kirjastoverkkopäivillä käsiteltäviä aiheita ovat muun muassa Melinda, Uusi kirjastojärjestelmä sekä Ontologia-hanke ONKI. Lisäksi keskiviikkoiltapäivänä järjestetään työpajoja eri aiheista.” sdate=”2013-10-23″ edate=”2013-10-24″ street=”Fabianinkatu 33″ pobox=”53″ city=”Helsinki” postalcode=”00014″ country=”FI” ]

Kirjastojärjestelmäkyselyn 2013 tuloksista

Library Technology Guiden vuosittainen kirjastoille tarkoitettu tyytyväisyyskysely on nyt koottu ja analysoitu. Kirjastojärjestelmäkyselyn tulokset löytyvät Library Technology Guiden sivuilta. Kyselyssä kartoitetaan kaikkien kirjastosektorien kokemuksia kirjastojärjestelmistään. Kyselyjä on järjestetty vuodesta 2007 lähtien. Uusimmassa kyselyssä lomake oli tarjolla englannin-, espanjan- ja ranskankielellä. Marshall Breeding on tehnyt kyselyn tuloksista kattavan analyysin: http://www.librarytechnology.org/perceptions2013.pl

Humpan henki kyselyssä on tämä:

  • jokaisesta kirjastosta vain 1 vastaus
  • 1 henkilö saa vastata vain kerran.

Teen muutamia omia nostojani kyselystä ja Breedingin katsauksesta.

Pirkanmaan osalta olen houkutellut alueen kirjastoja osallistumaan vuoden 2012 ja 2013 kyselyihin. Tampereen ja Pirkanmaan osalta menettelin näin: pyysin kirjastojen johtajia joko vastaamaan itse kyselyyn tai delegoimaan kyselyn sopivaksi katsomalleen henkilölle. Tampereen osalta vastausprosentti on oman kirjanpitoni mukaan 100 %. Muualta PIKIstä vastauksia tuli satunnaisesti.

Kysymyslomake löytyy täältä: http://www.librarytechnology.org/lwc-automation-survey-2013.pl

Suurimmassa osassa kysymyksistä annetaan numeerisia arvosanoja, esimerkiksi kuinka tyytyväisiä ollaan järjestelmätoimittajan tukipalveluun. Viiteen kysymykseen vastausvaihtoehtona oli numeroarvosana (0 – 9), joista 0 oli huonoin arvosana ja 9 paras. Kolmeen kysymykseen vastausvaihtoehdot olivat kyllä/ei. Lomakkeessa on 6 kenttää sanallisille vastauksille ja yksi kenttä vapaille kommenteille. Nämä sana on vapaa -vastaukset on koostettu tänne: http://www.librarytechnology.org/survey-2013-comments.pl?SID=20140208639465332

Vastauksia kyselyyn tuli yhteensä 3002 kpl. Vastaajia oli 53 maasta, ja edustetuimmat maat olivat

  1. USA (2314 vastausta)
  2. Kanada (150)
  3. Australia (106)
  4. Iso-Britannia (92)
  5. Uusi-Seelanti (38).

Suomesta tuli myös 38 vastausta. Naapurimaiden osalta Ruotsista vastauksia tuli 11 kpl, Norjasta 2 kpl, Virosta 1 kpl ja Venäjältä ei yhtään. Tanskalaisista kirjastoista 2 osallistui kyselyyn.

Demografiatilasto on täällä: http://www.librarytechnology.org/survey-2013-demographics.pl

Eniten vastauksia saaneet kirjastojärjestelmät olivat:

  • Destiny (368),
  • Symphony (324),
  • Millennium (254),
  • Atriuum (229),
  • OPALS (215),
  • Sierra (172),
  • Polaris (143),
  • Voyager (114),
  • Horizon (108),
  • ALEPH 500 (99),
  • Koha — ByWater Solutions (91),
  • Library.Solution(70),
  • AGent VERSO (68),
  • Apollo (54),
  • Evergreen — Equinox Software (54),
  • Koha — Independent (45),
  • LibraryWorld (43),
  • EOS.Web (39),
  • Axiell Aurora (33),
  • WorldShare Management Services (32),
  • Absys.Net (31),
  • Spydus (20).

Kyselyssä selvitettiin, mihin järjestelmiin on kovin veto kirjastomaailmassa. Nämä järjestelmät ovat

  • Alma (110),
  • Sierra (104) ja
  • WorldShare Management Services (103).

Kiinnostusta on myös Intotaan (44) ja Kuali OLE:en (21), jotka tosin eivät ole vielä tuotantokäytössä.

Vaihtoon halutaan mieluiten laittaa nämä 5 järjestelmää:

  • Voyager
  • Millenium
  • Horizon
  • Aleph
  • Virtua.

Hieman tilastovertailua

Breeding arvioi kyselyn tuloksia eri kokoisten kirjastojen osalta. Kokoluokat ovat

  • iso (large): kokoelmassa niteitä yli 500 001 kpl
  • keskikokoinen (medium sized): niteitä 100 001–500 000 kpl
  • pieni (small): niteitä alle 100 000 kpl
  • hyvin pieni (very small): niteitä 30 001–100 000 kpl.

Kokonaisuutena kyselyssä parhaiten suoriutuivat Polaris (sai hyvät arvosanat sekä isoilta että keskikokoisilta yleisiltä kirjastoilta) ja Biblionixin Apollo (sai hyvät arvosanat pieniltä ja hyvin pieniltä yleisiltä kirjastoilta). Alma ja Sierra saivat hyvät arvosanat suurilta korkeakoulukirjastoilta. Koha sai korkeimmat pisteet pieniltä korkeakoulukirjastoilta painetun materiaalin hallinnan osalta. OCLC WorldShare Management Services sai pieniltä korkeakoulukirjastoilta parhaat arvosanat e-aineiston hallinnan osalta.

Kokosin alemmas muutamia lukemia kotimaisten yleisten kirjastojen käytössä olevista järjestelmistä. Vastausprosentit Auroran ja PallasPron osalta ovat valitettavan pienet. Aurora-vastaajia oli 33 kirjastoa ja PallasPro-vastaajia 2. Sierra-vastauksia kyselyyn saatiin 172 kpl. Origo-vastauksia tänä vuonna ei tullut yhtään. PrettyLibiä ei löydy Library Technology Guiden järjestelmärekisteristä ollenkaan.

Koska Kohan käyttöönotto Pohjois-Karjalassa lähestyy ja Evergreen kiinnostaa minua muuten vain, kävin läpi suomalaisten yleisten kirjastojen käytössä olevien kirjastojärjestelmien lisäksi Evergreenin ja Kohan tuloksia. Vertailua hankaloittaa se, että vastaukset on ryhmitelty sen mukaan, mikä organisaatio tarjoaa järjestelmätukea.

Evergreenin osalta vastauksia on viidessä ryhmässä:

  1. Evergreen (tähän ryhmään kuuluvista tiedossa ei ole, miten vastanneet hoitavat järjestelmätuen)
  2. Evergreen — Alpha G (yhdysvaltalainen mm. Evergreen-tukipalveluja tarjoava yritys. Yritys tekee yhteistyötä Equinox Softwaren kanssa)
  3. Evergreen — Equinox Software (yhdysvaltalainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  4. Evergreen — Independent (ne vastanneet kirjastot, jotka järjestelmää ylläpitävät  itsenäisesti. Vastanneista 10 kpl oli tällaisia kirjastoja)
  5. Evergreen — MOBIUS (yhdysvaltalainen kirjastokonsortio).

Kohan osalta vastauksia on 14 ryhmässä:

  1. Koha (tähän ryhmään kuuluvista tiedossa ei ole, miten vastanneet hoitavat järjestelmätuen)
  2. Koha — Amigos Library Services (yhdysvaltalainen ei-kaupallinen, jäsenyyteen perustuva organisaatio, joka tarjoaa jäsenilleen muun muassa Koha-tukipalveluja)
  3. Koha — BibLibre (ranskalainen Koha-tukipalveluja tarjoava yritys)
  4. Koha — ByWater Solutions (yhdysvaltalainen Koha-tukipalveluja tarjoava yritys)
  5. Koha — CALYX (australialainen Koha-tukipalveluja tarjoava yritys)
  6. Koha — Catalyst (uusiseelantilainen Koha-tukipalveluja tarjoava yritys)
  7. Koha — DigiBEPÉ (argentiinalainen kirjastojen Koha-yhteisjärjestelmä, tukipalvelut tarjoaa CONABIP)
  8. Koha — Equinox Software (yhdysvaltalainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  9. Koha — Independent (ne vastanneet kirjastot, jotka ylläpitävät järjestelmäänsä itsenäisesti. Vastanneista 45 kpl oli tällaisia kirjastoja)
  10. Koha — Interleaf Technology (irlantilainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  11. Koha — Kobli (Espanjan Opetus-, kulttuuri- ja urheiluministeriön ylläpitämä Kohaan perustuva järjestelmä)
  12. Koha — LibLime (yhdysvaltalainen Koha-tukipalveluja tarjoava yritys)
  13. Koha — PTFS Europe (lontoolainen Koha-tukipalveluja tarjoava yritys)
  14. Koha — Prosentient Systems (australialainen ATK-tukipalveluja tarjoava yritys).

Alla olevaan vertailutaulukkoon laskin Evergreen- ja Koha-lukemat siten, että otin keskiarvon kuhunkin kohtaan kaikista ko. kohtaan tulleista Evergreen- ja Koha-vastauksista. Muutamia lukuja vertailtavaksi:

järjestelmä tyytyväisyys järjestelmään (ILS satisfaction) yhtiöuskollisuus (company loyalty) järjestelmän toimivuus (ILS functionality) tehokkuus painetun materiaalin hallinnassa (effectiveness for print) tehokkuus sähköisen materiaalin hallinnassa (electronic resources) tyytyväisyys tukipalveluun (support satisfaction)
Aurora 5.56 4.06 5.63 5.66 4.72 4.72
Evergreen 7.34 7.78 7.5 7.67 6.12 7.92
Koha 7.44 6.89 7.29 7.45 5.72 7.21
PallasPro 4.00 6.00 5.50 7.00 4.50 3.50
Sierra 6.55 6.38 6.86 7.55 5.98 6.13

Koska avoimen lähdekoodin puolella vastaajaryhmiä oli useita, sananen Evergreenin ja Kohan isoimmista vastaajaryhmistä. Evergreen-kirjastoista eniten vastauksia tuli Equinox Softwaren asiakkailta (54 kpl), joista kaikki eivät ilmoittaneet kirjastotyyppiään (yleinen kirjasto, korkeakoulukirjasto jne). Tyyppinsä ilmoittaneista yleisiä kirjastoja oli 43 kpl, korkeakoulukirjastoja 5 ja erikoiskirjastoja 1 kpl. Suurimmaksi osaksi kokoelmien koko liikkuu 10 001–100 000 niteessä. 11 kirjastolla 100 001–250 000 nidettä, 5 kirjastolla 250 001–1 000 000 ja 2 kirjastolla 1 000 001–10 000 000 nidettä.

Kohan isoin vastaajaryhmä olivat ByWater Solutionist’n asiakkaat. Vastaajia tässä ryhmässä oli 91 kpl, joista kaikki eivät ilmoittaneet kirjastotyyppiään. Suurin osa tyyppinsä ilmoittaneista kirjastoista oli yleisiä kirjastoja (53 kpl). Korkeakoulukirjastoja oli 21 kpl, koulukirjastoja 3 kpl ja erikoiskirjastoja 2. Kokoelmat liikkuvat suurimmalla osalla vastanneista 10 001–250 000 niteessä ja 100 001–250 000 niteessä.

Vertailun vuoksi Aurora- ja Sierra-kirjastojen luvut: Aurora-kirjastoilta vastauksia tuli 33 kpl, joista 25 yleistä kirjastoa (muut eivät ilmoittaneet tyyppiään). Kokoelmien osalta 7 kirjastoa ilmoitti olevansa alle 10 000 niteen kirjastoa, 12 kirjastoa 10 001–100 000 niteessä, 6 kirjastoa 100 001–250 000 niteessä, 1 kirjasto 1 000 001–10 000 000 niteessä.

Sierra-kirjastoilta vastauksia tuli 172 kpl. Yleisiksi kirjastoiksi ilmoittautui 64 kirjastoa. Suurimmalla osalla kirjastoista kokoelmien nidemäärä liikkui 250 001–1 000 000 kappaleessa.

Itseä tietenkin kiinnostavat Auroran saamat arvosanat muihin verrattuna. Jos PallasPro jätetään pois laskuista, Aurora pitää perää verrattuna Sierraan, Kohaan ja Evergreeniin. Vastausmäärät ovat pienet ja Aurora on avoimen lähdekoodin tuotteisiin verrattuna uudehko. Evergreen ja Koha ovat vanhempia ja toiminnoiltaan vakiintuneempia. Ensimmäisen ison käyttöönoton jälkeen (PIKI 2010) Aurora on kypsynyt, mutta vielä se ei ole ottanut kiinni iäkkäämpiä kollegoitaan.

Kommentteja kyselystä

Sain PIKIstä muutamia kommentteja kyselystä. Yleisin oli se, että osa kysymyksistä meni ohi yksittäisen vastaajan vastuualueen. Tällainen oli esimerkiksi kysymys halukkuudesta siirtyä käyttämään avoimen lähdekoodin kirjastojärjestelmää. Totta on, että kirjastokimpoissa yksittäinen henkilö tuskin itsenäisesti voi tällaista päätöstä tehdä. Tärkeää tuossa kysymyksessä on minusta se, että kysymyksellä mitataan hieman mielipideilmastoa tämän(kin) aiheen suhteen. Olennaisin juttu kuitenkin on, että saamme kartoitettua ns. peruskysymyksiä, kuten millaiseksi koetaan maakunnassa kirjastojärjestelmän käytettävyys, millainen kokemus meillä on tukipalveluista jne.

 

Yleisten kirjastojen aluetietokannat syynissä

nmorao, Regional 5120, http://www.flickr.com/photos/nmorao/4065996219/
nmorao, Regional 5120, http://www.flickr.com/photos/nmorao/4065996219/

Yleisillä kirjastoilla on jo jonkinmoinen historia aluetietokantojen ylläpitämisestä. Aluetietokantoja on rakennettu erilaisista lähtökohdista ja erilaisin välinein. Aluetietokantoihin panostetaan eri tavoin: osalla kirjastoissa on useita hyvin erikoistuneita aluetietokantoja, osalla ei välttämättä ole omaa erillistä aluetietokantaa. Nyt kun yleisten kirjastojen järjestelmätilanne Suomessa on käymässä läpi isoja muutoksia, on tullut sopiva sauma pohtia aluetietokantojen tulevaisuutta.

Meneillään olevassa Aluetietokantaselvitys-projektissa kartoitetaan aluetietokantojen nykytilaa, ylläpitoa, kehityssuunnitelmia ja -toiveita. Projektin työryhmässä ovat lisäkseni:

  • Anna-Mari Andersson, Kouvolan kaupunginkirjasto
  • Johanna Jauhonen, Tampereen kaupunginkirjasto
  • Jaana Käki, Hämeenlinnan kaupunginkirjasto
  • Liisa Rossi, Kuopion kaupunginkirjasto
  • Maija Saraste, Oulun kaupunginkirjasto
  • Tiina Teijonsalo, Jyväskylän kaupunginkirjasto
  • Sami Varjo, Vaasan kaupunginkirjasto.

Aluetietokannalla tarkoitamme kirjaston kokoamaa ja ylläpitämää alueellista tietoa sisältävää tietokantaa tai sivustoa.

Tärkeä osa projektia on yleisille kirjastoille suunnattu kysely. Kysely on tarkoitettu maakuntakirjastoille ja sellaisille yleisille kirjastoille, jotka ylläpitävät ja hallinnoivat aluetietokantaa. Kokonaiskuvan saamiseksi vastauksia toivomme, vaikka aluetietokantaa ei enää olisi.

Projekti kestää toukokuulle 2014, mutta jonkinlainen puolivälinkrouvi tuntui tulleen tänään. Julkaisimme kyselyn verkossa ja lähetimme maakuntakirjastojen johtajille pyynnön vastata omien alueiden osalta kyselyyn. Samalla toivomme, että sana kyselystä leviäisi niille omia aluetietokantojaan ylläpitäville kirjastoille, joita emme hoksanneet lähestyä suoraan sähköpostitse.

Kyselyn deadline on 28.2.2014.

Kysely on osoitteessa:

https://palvelut2.tampere.fi/e3/lomakkeet/7976/lomake.html

Hankehakemus tarkempine projektikuvauksineen on Yleisten kirjastojen hankerekisteri -sivustolla:

http://hankkeet.kirjastot.fi/hanke/selvitys-aluetietokannoista-ja-niiden-suhteesta-kansalliseen-metatietovarantoon

[schema type=”event” evtype=”Event” url=”https://palvelut2.tampere.fi/e3/lomakkeet/7976/lomake.html” name=”Aluetietokantojen nykytila ja tulevaisuus” description=”Tämä kysely koskee aluetietokantoja, niiden nykytilaa ja tulevaisuutta. Aluetietokannalla tarkoitetaan tässä kyselyssä kirjaston kokoamaa ja ylläpitämää alueellista tietoa sisältävää tietokantaa tai sivustoa, ei kuitenkaan kirjailijatietokantaa.” sdate=”2014-02-07″ stime=”03:00 pm” edate=”2014-02-28″ country=”FI” ]

Avoin data ja avoimet sisällöt – museoille uusi mahdollisuus vai uusi menoerä?

Kimmo Levä esitteli taustalla vireillä olevia asioita: tekijänoikeuslakia ollaan uudistamassa ja uudistettu laki voi tuoda jotain helpotusta datan avaamiseen. Henkilötietolaki kannattaa muistaa: jos tietokanta sisältää henkilötietoja, joiden avulla henkilöitä on tunnistettavissa, tarvitaan lupa julkaisemiselle. Tämä koskee myös kuolleita ja heidän lähipiiriään.

Miksi julkaista:

  • kokoelmat ovat käyttöä varten, joten on järkevää edistää kokoelmien käyttöä eri tavoin
  • museokokoelmat ovat lähtökohtaisesti julkiset
  • asiakas on verkossa ja ”vain verkkomateriaali on olemassa”
  • museoita rahoitetaan merkittävästi yhteisistä varoista.

Taloudelliset mahdollisuudet ja menoerät

Datan avaaminen sisältää erilaisia potentiaalisesti positiivisia seurauksia: yhteiskunnallisen läpinäkyvyyden lisääntymisen lisäksi datan avaaminen tuo hyvää karmaa organisaatioille. Julkisin varoin tuotetun datan avaaminen on lähtökohtaisesti hyvä teko organisaatiolta. Säästöihin voi aueta mahdollisuuksia, mikäli dataa hyödynnetään tai jalostetaan joukkoistamisen kautta.

Potentiaalisia menoeriä ovat tekijänoikeusriski, mikä voi realisoitua, jos avattu data sisältää tekijänoikeuden suojaamaa materiaalia. Datan avaaminen todennäköisesti tuo muassaan uusia työtehtäviä ja lisää työn määrää organisaatiossa.

Avoimen datan ansaintalogiikka

Levän mukaan kestävää on se, että asiakas maksaa jotain. Käytännössä tämä voisi mennä kuvatietokantojen osalta niin, että julkaistaan metadata avoimena ja otetaan maksu varsinaisesta kuvasta. Avoimen datan positiivisista yhteiskunnallisista vaikutuksista puhutaan. Miten saadaan tasattua yhteiskunnan saamat lisätulot avoimesta datasta ja organisaatioille koituvat menot avoimesta datasta, jos esimerkiksi museolle datan avaus maksaa X euroa ja yhteiskunta saa tuloja X euroa?

 

Avoimen datan mahdollisuuksista museossa

Kimmo Antila (Postimuseo) kysyi puheessaan käyttäjyyden ja datan hyödyntämisen perään. Datan avaamisessa(kin) pitäisi miettiä käyttäjyyttä eli kenelle näitä juttuja tehdään. Hyvä kysymys, onko avoin data itseisarvo vai itseasiassa kontekstuaalinen, kuratoitu tieto? Antila korosti kuratoinnin ja analysoinnin tärkeyttä. Datan avaamisen lisäksi organisaation pitäisi analysoida ja tulkita dataa.

Kokeiluja voi tehdä jo olemassa olevilla avoimeen dataan pohjautuvilla työkaluilla. Esimerkiksi Mediawikiä ja Wikipediaa voidaan hyödyntää erilaisten tietovarantojen ja oman osaamisen esilletuonnissa. Näin esimerkiksi tehtiin Rupriikin järjestämässä wiki-työpajassa 9.11.2013.

Tärkeää olisi näyttelyjen ohessa lisätä/parantaa jo olemassa tietoa: kun kokoelmia tuodaan esiin, olisi hyvä pyrkiä samalla lisäämään tietoa ko. aiheesta. Erilainen tutkijayhteistyö näyttelyiden osalta on tärkeää; tästä oli kyse esimerkiksi Inventing Europe -hankkeessa. Joukkoistamista datan rikastamisessa on tutkinut Ari Häyrinen väitöskirjassaan Open sourcing digital heritage : digital surrogates, museums and knowledge management in the age of open networks.

Kimmo Antila asetti datan avauksen hienoksi tavoitteeksi synnyttää uutta luovaa, vuorovaikutteista ja kaikkia osapuolia hyödyttävää tietoa.