Mikä pelastaa kenet ja miten?

Teknologian yhteiskunnallisia vaikutuksia pohtiva Jevgeni Morozov julkaisi viime vuonna teoksen To save everything, click here : the folly of technological solutionism (2013).

Morozovin ote teknologiaan on kriittinen. Oskari Onninen kuvailee Morozovia kyberpessimistiksi, ja tämä termi kuvaa kohdettaan erinomaisesti. Morozov on aktiivinen monilla foorumeilla. Osa hänen artikkeleistaan löytyy täältä: http://evgenymorozov.com/writings.html

Hänen esikoisteoksensa on The Net Delusion : The Dark Side of Internet Freedom (2011). Arvion teoksesta on julkaissut Ulkopolitiikka-lehti. Uusimmasta teoksesta on julkaistu useampia arvioita:

Morozov kritisoi koko joukon Internetissä vaikuttavista ilmiöistä. Osansa saavat muun muassa algoritmeihin pohjautuvat teknologiat, big data ja tiedonlouhinta, avoin data -liike, joukkouttaminen. Erityiskohteenaan hänellä on ihmisryhmä, joka uskoo vahvasti teknologian mahdollisuuksiin. Siis jonkinlaiset teknofiilit, joita Morozov kutsuu solutionisteiksi.

Solutionistien lisäksi Morozov antaa John Petersin tavoin kolipottua verkkoympäristössä toimiville yrityksille, kuten Amazonille ja Googlelle. Morozovin teos on mielenkiintoinen. Seuraavissa erissä pari merkintää teemoista:

  1. Solutionismista
  2. Algoritmeista
  3. Data-intensiivisyys, itsensä monitorointi, datan jakaminen
  4. Avoin data, avoin hallitus
  5. Big data ja solutionismin kritiikkiä
  6. Joukkoistaminen ja MOOCit
  7. Ratkaisuvaihtoehtoja
  8. Jälkimausta

[schema type=”review” url=”http://clickherethebook.com/” rev_name=”To Save Everything, Click Here” author=”Jevgeni Morozov” ]

Avoin tieto kirjastojen, arkistojen ja museoiden mahdollisuutena

Kulttuuriasiainneuvos Minna Karvonen kävi esityksessään läpi muistiorganisaatioihin liittyviä avoin data -asioita. Hallitusohjelmassa on monia kytköksiä avoimeen dataan, jotka liippaavat myös muistiorganisaatioita.

Karvonen esitteli Opetus- ja kulttuuriministeriön OKM-KIDE-älystrategiaa. Strategia on tehty vuosille 2013–2016, ja se koostuu kahdesta tavoitekokonaisuudesta

  1. osaamisen ja osallisuuden lisääminen
  2. digitaalisten sisältöjen ja palvelujen kehittäminen muun muassa käyttäjälähtöisyyden ja saavutettavuuden näkökulmasta.

Käytännön toimenpiteitä ovat Museoviraston Museo 2015 ja Kansalliskirjaston KDK ja Melinda, CSC:n Tutkimuksen tietoaineistot (TTA), Avoin-hankkeen ja AVAA-projektin muodostama hanketripla. Näissä projekteissa rakennetaan avoimen datan infrastruktuuria.

Osaamispuolella OKM kiinnittää huomiota tietovarantoihin liittyvän laajapohjaiseen osaamiseen ja media- ja informaatiolukutaitoon. Tarkoitus on myös vahvistaa kulttuurisektorin organisaatioiden ja käyttäjien yhteistyötä.

Karvosella oli esityksessään 5 kysymystä, jotka ovat olennaisia avoimen tiedon hyödynnettävyyden kannalta

  1. koneluettavuus?
  2. maksuttomuus?
  3. vapaasti käytettävissä?
  4. helpposaatavuus?
  5. saako tolkun? Kirjastopuolella tämä tarkoittaisi MARC 21 -formaatin ”suomentamista” alan ulkopuolisille toimijoille, jotka haluaisivat hyödyntää dataa.

Yleisökysymyksessä kysyttiin OKM:n kantaa PSI-direktiiviin. Direktiivi on käytössä ja sitä on sovellettava kansallisesti. Juristiarmeija miettii ainakin vuoden 2013, miten sovellettaisiin ja miten direktiivi implementoidaan meillä. Iso muutos verrattuna aiempaan vastaavaan direktiiviin vuodelta 2003 on, että PSI-direktiivi koskee muistiorganisaatioita ja että se ei koske tekijänoikeuden alaista aineistoa. PSI:ssä on loivennuksia muistiorganisaatioiden kohdalla.

Avoimen tiedon ohjelma 2013 – 2015

Valtiovarainministeriön Anne Kauhanen-Simanainen esitteli ministeriön avoimen tiedon ohjelmaa. Avoimella tiedolla on pitkä historia: juuria löytyy julkisuusperiaatteesta 1700-luvulta. Vuonna 1766 tulivat julkisuuslaki, sanan ja painovapaus jne.

Avoin tieto on noussut hallitusohjelman kärkihankkeeksi. Dataa on avattava kansalaisten ja yritysten käyttöön, ja julkishallinnossa onkin tehty linjauksia ja toimenpiteitä datan avaamiseksi. Taustalla on big data -ajattelu eli massiiviset määrät raakadataa, josta tiedonlouhinnan menetelmin tehdään esimerkiksi analyysia ja ennusteita.

Julkishallinnosta ollaan leipomassa katalysaattoria avoimen datan julkaisemiselle ja hyödyntämiselle. Tähän suuntaan on johdattelemassa muun muassa ICT 2015 -työryhmän 21 kehityspolkua -ehdotukset.

Datan avausta perustellaan muun muassa sillä, että on kansantaloudellisesti järkevää hyödyntää julkisin varoin tuotettua dataa mahdollisimman paljon. Datan avaamisen kerrotaan myös lisäävän läpinäkyvyyttä ja demokratiaa, tehostavan hallintoa, monipuolistavan koulutuksen ja tutkimuksen aineistoja. Hyödyt avaamisesta ovat suuremmat kuin kustannukset.

Esimerkkejä arkea helpottavista ja hallinnonalojen rajat ylittävistä palveluista on muun muassa:

Valtiovarainministeriön Avoimen tiedon ohjelmassa 2013–2015 kehitetään datan avauskäytäntöjä siten, että tietovarantojen avaamisesta tulee osa hallinnon normaalia toimintaa ja että datan avoimuus huomioidaan jo tietojärjestelmiä suunniteltaessa ja hankittaessa.

JulkICT-toiminto-sivusto kertoo, että ohjelmassa toteutetaan myös julkishallinnon tietovarantojen löytämistä ja hyödyntämistä helpottava kansallinen avoimen datan alusta, ns. ”dataportaali” ja avoimeen dataan perustuvien palvelujen kehittämisympäristö JulkICTLab.

Yhteistyöverkostosta tavoitellaan laajaa: mukaan halutaan kansalaiset, yritykset, organisaatiot ja julkinen sektori. Ministeriöt vievät asiaa eteenpäin eri ohjelmissaan.

Onko avoin data uusi selviämistarina? Ministeriö näkee avoimen datan samantapaisena kehitysaskeleena kuin  vaikkapa lukutaidon 1900-luvulla ja jälleenrakentamiskauden 1950-luvulla, jolloin puunjalostusteollisuus oli kehityksen kärjessä. Paljon odotuksia avoimuudelle.

SPARQLaamisesta ja KBARTista

anderoche, SPARKLES! https://www.flickr.com/photos/anderoche/5691737246/sizes/l/
anderoche, SPARKLES! https://www.flickr.com/photos/anderoche/5691737246/sizes/l/

Osallistuin Kirjastoverkkopäiville 23.–24.10.2013. Parin seuraavan bloggauksessa muistiinpanojani päiviltä.

Ensimmäisenä päivänä ehdin iltapäivän Sini Pessalan vetämään SPARQL-työpajasessioon, joka olikin täyden kympin työpaja. Toivottavasti tämän tapaisia hands on -työleirejä järjestetään jatkossakin. Vaikka SPARQL-syvällisyyksiä en valitettavasti kyennyt sisäistämään juuri tällä istunnolla, avautui kyselykieli huomattavasti paremmin kun sitä käpisteli omin käsin.

Magaly Bascones esitteli Knowledge Bases and Related Tools (KBART) -työryhmän tuloksia. KBART on selvittänyt datan tuottamis- ja välitysprosesseja OpenURL-linkityspalveluympäristössä. Mukana työssä on ollut yliopistoja, järjestelmätoimittajia (esimerkiksi OCLC) ja sisällöntuottajia (esimerkiksi Springer). Työn tuloksena on syntynyt muun muassa suosituksia, kuinka kehittää tuossa ympäristössä datan välitysprosesseja. Metadatan vaihtoformaatti sopiminen on yksi näistä saavutuksista.

Datan hyödynnettävyyden edellytyksenä on ilmeisen datan oikeellisuuden lisäksi datan oikea-aikaisuus. Työprosesseja hiotaan, jotta kirjastossa minimoitaisiin datan muokkaukseen ja virheiden korjaamiseen menevä aika. Nyt on menossa hankkeen kakkosvaihe, jossa pohditaan miten ilmaistaan sisältöjen mahdollinen avoin saatavuus. E-kirjojen saatavuustiedot ovat toinen pohdinnan paikka; saatavuustieto ei ole täydellistä eikä standardia.

[schema type=”event” evtype=”Event” url=”http://www.kansalliskirjasto.fi/kirjastoala/tapahtumat/1353590305481.html” name=”Kirjastoverkkopäivät 2013″ description=”Tämänkertaisilla Kirjastoverkkopäivillä käsiteltäviä aiheita ovat muun muassa Melinda, Uusi kirjastojärjestelmä sekä Ontologia-hanke ONKI. Lisäksi keskiviikkoiltapäivänä järjestetään työpajoja eri aiheista.” sdate=”2013-10-23″ edate=”2013-10-24″ street=”Fabianinkatu 33″ pobox=”53″ city=”Helsinki” postalcode=”00014″ country=”FI” ]

Kirjastojärjestelmäkyselyn 2013 tuloksista

Library Technology Guiden vuosittainen kirjastoille tarkoitettu tyytyväisyyskysely on nyt koottu ja analysoitu. Kirjastojärjestelmäkyselyn tulokset löytyvät Library Technology Guiden sivuilta. Kyselyssä kartoitetaan kaikkien kirjastosektorien kokemuksia kirjastojärjestelmistään. Kyselyjä on järjestetty vuodesta 2007 lähtien. Uusimmassa kyselyssä lomake oli tarjolla englannin-, espanjan- ja ranskankielellä. Marshall Breeding on tehnyt kyselyn tuloksista kattavan analyysin: http://www.librarytechnology.org/perceptions2013.pl

Humpan henki kyselyssä on tämä:

  • jokaisesta kirjastosta vain 1 vastaus
  • 1 henkilö saa vastata vain kerran.

Teen muutamia omia nostojani kyselystä ja Breedingin katsauksesta.

Pirkanmaan osalta olen houkutellut alueen kirjastoja osallistumaan vuoden 2012 ja 2013 kyselyihin. Tampereen ja Pirkanmaan osalta menettelin näin: pyysin kirjastojen johtajia joko vastaamaan itse kyselyyn tai delegoimaan kyselyn sopivaksi katsomalleen henkilölle. Tampereen osalta vastausprosentti on oman kirjanpitoni mukaan 100 %. Muualta PIKIstä vastauksia tuli satunnaisesti.

Kysymyslomake löytyy täältä: http://www.librarytechnology.org/lwc-automation-survey-2013.pl

Suurimmassa osassa kysymyksistä annetaan numeerisia arvosanoja, esimerkiksi kuinka tyytyväisiä ollaan järjestelmätoimittajan tukipalveluun. Viiteen kysymykseen vastausvaihtoehtona oli numeroarvosana (0 – 9), joista 0 oli huonoin arvosana ja 9 paras. Kolmeen kysymykseen vastausvaihtoehdot olivat kyllä/ei. Lomakkeessa on 6 kenttää sanallisille vastauksille ja yksi kenttä vapaille kommenteille. Nämä sana on vapaa -vastaukset on koostettu tänne: http://www.librarytechnology.org/survey-2013-comments.pl?SID=20140208639465332

Vastauksia kyselyyn tuli yhteensä 3002 kpl. Vastaajia oli 53 maasta, ja edustetuimmat maat olivat

  1. USA (2314 vastausta)
  2. Kanada (150)
  3. Australia (106)
  4. Iso-Britannia (92)
  5. Uusi-Seelanti (38).

Suomesta tuli myös 38 vastausta. Naapurimaiden osalta Ruotsista vastauksia tuli 11 kpl, Norjasta 2 kpl, Virosta 1 kpl ja Venäjältä ei yhtään. Tanskalaisista kirjastoista 2 osallistui kyselyyn.

Demografiatilasto on täällä: http://www.librarytechnology.org/survey-2013-demographics.pl

Eniten vastauksia saaneet kirjastojärjestelmät olivat:

  • Destiny (368),
  • Symphony (324),
  • Millennium (254),
  • Atriuum (229),
  • OPALS (215),
  • Sierra (172),
  • Polaris (143),
  • Voyager (114),
  • Horizon (108),
  • ALEPH 500 (99),
  • Koha — ByWater Solutions (91),
  • Library.Solution(70),
  • AGent VERSO (68),
  • Apollo (54),
  • Evergreen — Equinox Software (54),
  • Koha — Independent (45),
  • LibraryWorld (43),
  • EOS.Web (39),
  • Axiell Aurora (33),
  • WorldShare Management Services (32),
  • Absys.Net (31),
  • Spydus (20).

Kyselyssä selvitettiin, mihin järjestelmiin on kovin veto kirjastomaailmassa. Nämä järjestelmät ovat

  • Alma (110),
  • Sierra (104) ja
  • WorldShare Management Services (103).

Kiinnostusta on myös Intotaan (44) ja Kuali OLE:en (21), jotka tosin eivät ole vielä tuotantokäytössä.

Vaihtoon halutaan mieluiten laittaa nämä 5 järjestelmää:

  • Voyager
  • Millenium
  • Horizon
  • Aleph
  • Virtua.

Hieman tilastovertailua

Breeding arvioi kyselyn tuloksia eri kokoisten kirjastojen osalta. Kokoluokat ovat

  • iso (large): kokoelmassa niteitä yli 500 001 kpl
  • keskikokoinen (medium sized): niteitä 100 001–500 000 kpl
  • pieni (small): niteitä alle 100 000 kpl
  • hyvin pieni (very small): niteitä 30 001–100 000 kpl.

Kokonaisuutena kyselyssä parhaiten suoriutuivat Polaris (sai hyvät arvosanat sekä isoilta että keskikokoisilta yleisiltä kirjastoilta) ja Biblionixin Apollo (sai hyvät arvosanat pieniltä ja hyvin pieniltä yleisiltä kirjastoilta). Alma ja Sierra saivat hyvät arvosanat suurilta korkeakoulukirjastoilta. Koha sai korkeimmat pisteet pieniltä korkeakoulukirjastoilta painetun materiaalin hallinnan osalta. OCLC WorldShare Management Services sai pieniltä korkeakoulukirjastoilta parhaat arvosanat e-aineiston hallinnan osalta.

Kokosin alemmas muutamia lukemia kotimaisten yleisten kirjastojen käytössä olevista järjestelmistä. Vastausprosentit Auroran ja PallasPron osalta ovat valitettavan pienet. Aurora-vastaajia oli 33 kirjastoa ja PallasPro-vastaajia 2. Sierra-vastauksia kyselyyn saatiin 172 kpl. Origo-vastauksia tänä vuonna ei tullut yhtään. PrettyLibiä ei löydy Library Technology Guiden järjestelmärekisteristä ollenkaan.

Koska Kohan käyttöönotto Pohjois-Karjalassa lähestyy ja Evergreen kiinnostaa minua muuten vain, kävin läpi suomalaisten yleisten kirjastojen käytössä olevien kirjastojärjestelmien lisäksi Evergreenin ja Kohan tuloksia. Vertailua hankaloittaa se, että vastaukset on ryhmitelty sen mukaan, mikä organisaatio tarjoaa järjestelmätukea.

Evergreenin osalta vastauksia on viidessä ryhmässä:

  1. Evergreen (tähän ryhmään kuuluvista tiedossa ei ole, miten vastanneet hoitavat järjestelmätuen)
  2. Evergreen — Alpha G (yhdysvaltalainen mm. Evergreen-tukipalveluja tarjoava yritys. Yritys tekee yhteistyötä Equinox Softwaren kanssa)
  3. Evergreen — Equinox Software (yhdysvaltalainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  4. Evergreen — Independent (ne vastanneet kirjastot, jotka järjestelmää ylläpitävät  itsenäisesti. Vastanneista 10 kpl oli tällaisia kirjastoja)
  5. Evergreen — MOBIUS (yhdysvaltalainen kirjastokonsortio).

Kohan osalta vastauksia on 14 ryhmässä:

  1. Koha (tähän ryhmään kuuluvista tiedossa ei ole, miten vastanneet hoitavat järjestelmätuen)
  2. Koha — Amigos Library Services (yhdysvaltalainen ei-kaupallinen, jäsenyyteen perustuva organisaatio, joka tarjoaa jäsenilleen muun muassa Koha-tukipalveluja)
  3. Koha — BibLibre (ranskalainen Koha-tukipalveluja tarjoava yritys)
  4. Koha — ByWater Solutions (yhdysvaltalainen Koha-tukipalveluja tarjoava yritys)
  5. Koha — CALYX (australialainen Koha-tukipalveluja tarjoava yritys)
  6. Koha — Catalyst (uusiseelantilainen Koha-tukipalveluja tarjoava yritys)
  7. Koha — DigiBEPÉ (argentiinalainen kirjastojen Koha-yhteisjärjestelmä, tukipalvelut tarjoaa CONABIP)
  8. Koha — Equinox Software (yhdysvaltalainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  9. Koha — Independent (ne vastanneet kirjastot, jotka ylläpitävät järjestelmäänsä itsenäisesti. Vastanneista 45 kpl oli tällaisia kirjastoja)
  10. Koha — Interleaf Technology (irlantilainen Evergreen- ja Koha-tukipalveluja tarjoava yritys)
  11. Koha — Kobli (Espanjan Opetus-, kulttuuri- ja urheiluministeriön ylläpitämä Kohaan perustuva järjestelmä)
  12. Koha — LibLime (yhdysvaltalainen Koha-tukipalveluja tarjoava yritys)
  13. Koha — PTFS Europe (lontoolainen Koha-tukipalveluja tarjoava yritys)
  14. Koha — Prosentient Systems (australialainen ATK-tukipalveluja tarjoava yritys).

Alla olevaan vertailutaulukkoon laskin Evergreen- ja Koha-lukemat siten, että otin keskiarvon kuhunkin kohtaan kaikista ko. kohtaan tulleista Evergreen- ja Koha-vastauksista. Muutamia lukuja vertailtavaksi:

järjestelmä tyytyväisyys järjestelmään (ILS satisfaction) yhtiöuskollisuus (company loyalty) järjestelmän toimivuus (ILS functionality) tehokkuus painetun materiaalin hallinnassa (effectiveness for print) tehokkuus sähköisen materiaalin hallinnassa (electronic resources) tyytyväisyys tukipalveluun (support satisfaction)
Aurora 5.56 4.06 5.63 5.66 4.72 4.72
Evergreen 7.34 7.78 7.5 7.67 6.12 7.92
Koha 7.44 6.89 7.29 7.45 5.72 7.21
PallasPro 4.00 6.00 5.50 7.00 4.50 3.50
Sierra 6.55 6.38 6.86 7.55 5.98 6.13

Koska avoimen lähdekoodin puolella vastaajaryhmiä oli useita, sananen Evergreenin ja Kohan isoimmista vastaajaryhmistä. Evergreen-kirjastoista eniten vastauksia tuli Equinox Softwaren asiakkailta (54 kpl), joista kaikki eivät ilmoittaneet kirjastotyyppiään (yleinen kirjasto, korkeakoulukirjasto jne). Tyyppinsä ilmoittaneista yleisiä kirjastoja oli 43 kpl, korkeakoulukirjastoja 5 ja erikoiskirjastoja 1 kpl. Suurimmaksi osaksi kokoelmien koko liikkuu 10 001–100 000 niteessä. 11 kirjastolla 100 001–250 000 nidettä, 5 kirjastolla 250 001–1 000 000 ja 2 kirjastolla 1 000 001–10 000 000 nidettä.

Kohan isoin vastaajaryhmä olivat ByWater Solutionist’n asiakkaat. Vastaajia tässä ryhmässä oli 91 kpl, joista kaikki eivät ilmoittaneet kirjastotyyppiään. Suurin osa tyyppinsä ilmoittaneista kirjastoista oli yleisiä kirjastoja (53 kpl). Korkeakoulukirjastoja oli 21 kpl, koulukirjastoja 3 kpl ja erikoiskirjastoja 2. Kokoelmat liikkuvat suurimmalla osalla vastanneista 10 001–250 000 niteessä ja 100 001–250 000 niteessä.

Vertailun vuoksi Aurora- ja Sierra-kirjastojen luvut: Aurora-kirjastoilta vastauksia tuli 33 kpl, joista 25 yleistä kirjastoa (muut eivät ilmoittaneet tyyppiään). Kokoelmien osalta 7 kirjastoa ilmoitti olevansa alle 10 000 niteen kirjastoa, 12 kirjastoa 10 001–100 000 niteessä, 6 kirjastoa 100 001–250 000 niteessä, 1 kirjasto 1 000 001–10 000 000 niteessä.

Sierra-kirjastoilta vastauksia tuli 172 kpl. Yleisiksi kirjastoiksi ilmoittautui 64 kirjastoa. Suurimmalla osalla kirjastoista kokoelmien nidemäärä liikkui 250 001–1 000 000 kappaleessa.

Itseä tietenkin kiinnostavat Auroran saamat arvosanat muihin verrattuna. Jos PallasPro jätetään pois laskuista, Aurora pitää perää verrattuna Sierraan, Kohaan ja Evergreeniin. Vastausmäärät ovat pienet ja Aurora on avoimen lähdekoodin tuotteisiin verrattuna uudehko. Evergreen ja Koha ovat vanhempia ja toiminnoiltaan vakiintuneempia. Ensimmäisen ison käyttöönoton jälkeen (PIKI 2010) Aurora on kypsynyt, mutta vielä se ei ole ottanut kiinni iäkkäämpiä kollegoitaan.

Kommentteja kyselystä

Sain PIKIstä muutamia kommentteja kyselystä. Yleisin oli se, että osa kysymyksistä meni ohi yksittäisen vastaajan vastuualueen. Tällainen oli esimerkiksi kysymys halukkuudesta siirtyä käyttämään avoimen lähdekoodin kirjastojärjestelmää. Totta on, että kirjastokimpoissa yksittäinen henkilö tuskin itsenäisesti voi tällaista päätöstä tehdä. Tärkeää tuossa kysymyksessä on minusta se, että kysymyksellä mitataan hieman mielipideilmastoa tämän(kin) aiheen suhteen. Olennaisin juttu kuitenkin on, että saamme kartoitettua ns. peruskysymyksiä, kuten millaiseksi koetaan maakunnassa kirjastojärjestelmän käytettävyys, millainen kokemus meillä on tukipalveluista jne.

 

Yleisten kirjastojen aluetietokannat syynissä

nmorao, Regional 5120, http://www.flickr.com/photos/nmorao/4065996219/
nmorao, Regional 5120, http://www.flickr.com/photos/nmorao/4065996219/

Yleisillä kirjastoilla on jo jonkinmoinen historia aluetietokantojen ylläpitämisestä. Aluetietokantoja on rakennettu erilaisista lähtökohdista ja erilaisin välinein. Aluetietokantoihin panostetaan eri tavoin: osalla kirjastoissa on useita hyvin erikoistuneita aluetietokantoja, osalla ei välttämättä ole omaa erillistä aluetietokantaa. Nyt kun yleisten kirjastojen järjestelmätilanne Suomessa on käymässä läpi isoja muutoksia, on tullut sopiva sauma pohtia aluetietokantojen tulevaisuutta.

Meneillään olevassa Aluetietokantaselvitys-projektissa kartoitetaan aluetietokantojen nykytilaa, ylläpitoa, kehityssuunnitelmia ja -toiveita. Projektin työryhmässä ovat lisäkseni:

  • Anna-Mari Andersson, Kouvolan kaupunginkirjasto
  • Johanna Jauhonen, Tampereen kaupunginkirjasto
  • Jaana Käki, Hämeenlinnan kaupunginkirjasto
  • Liisa Rossi, Kuopion kaupunginkirjasto
  • Maija Saraste, Oulun kaupunginkirjasto
  • Tiina Teijonsalo, Jyväskylän kaupunginkirjasto
  • Sami Varjo, Vaasan kaupunginkirjasto.

Aluetietokannalla tarkoitamme kirjaston kokoamaa ja ylläpitämää alueellista tietoa sisältävää tietokantaa tai sivustoa.

Tärkeä osa projektia on yleisille kirjastoille suunnattu kysely. Kysely on tarkoitettu maakuntakirjastoille ja sellaisille yleisille kirjastoille, jotka ylläpitävät ja hallinnoivat aluetietokantaa. Kokonaiskuvan saamiseksi vastauksia toivomme, vaikka aluetietokantaa ei enää olisi.

Projekti kestää toukokuulle 2014, mutta jonkinlainen puolivälinkrouvi tuntui tulleen tänään. Julkaisimme kyselyn verkossa ja lähetimme maakuntakirjastojen johtajille pyynnön vastata omien alueiden osalta kyselyyn. Samalla toivomme, että sana kyselystä leviäisi niille omia aluetietokantojaan ylläpitäville kirjastoille, joita emme hoksanneet lähestyä suoraan sähköpostitse.

Kyselyn deadline on 28.2.2014.

Kysely on osoitteessa:

https://palvelut2.tampere.fi/e3/lomakkeet/7976/lomake.html

Hankehakemus tarkempine projektikuvauksineen on Yleisten kirjastojen hankerekisteri -sivustolla:

http://hankkeet.kirjastot.fi/hanke/selvitys-aluetietokannoista-ja-niiden-suhteesta-kansalliseen-metatietovarantoon

[schema type=”event” evtype=”Event” url=”https://palvelut2.tampere.fi/e3/lomakkeet/7976/lomake.html” name=”Aluetietokantojen nykytila ja tulevaisuus” description=”Tämä kysely koskee aluetietokantoja, niiden nykytilaa ja tulevaisuutta. Aluetietokannalla tarkoitetaan tässä kyselyssä kirjaston kokoamaa ja ylläpitämää alueellista tietoa sisältävää tietokantaa tai sivustoa, ei kuitenkaan kirjailijatietokantaa.” sdate=”2014-02-07″ stime=”03:00 pm” edate=”2014-02-28″ country=”FI” ]

Avoin data ja avoimet sisällöt – museoille uusi mahdollisuus vai uusi menoerä?

Kimmo Levä esitteli taustalla vireillä olevia asioita: tekijänoikeuslakia ollaan uudistamassa ja uudistettu laki voi tuoda jotain helpotusta datan avaamiseen. Henkilötietolaki kannattaa muistaa: jos tietokanta sisältää henkilötietoja, joiden avulla henkilöitä on tunnistettavissa, tarvitaan lupa julkaisemiselle. Tämä koskee myös kuolleita ja heidän lähipiiriään.

Miksi julkaista:

  • kokoelmat ovat käyttöä varten, joten on järkevää edistää kokoelmien käyttöä eri tavoin
  • museokokoelmat ovat lähtökohtaisesti julkiset
  • asiakas on verkossa ja ”vain verkkomateriaali on olemassa”
  • museoita rahoitetaan merkittävästi yhteisistä varoista.

Taloudelliset mahdollisuudet ja menoerät

Datan avaaminen sisältää erilaisia potentiaalisesti positiivisia seurauksia: yhteiskunnallisen läpinäkyvyyden lisääntymisen lisäksi datan avaaminen tuo hyvää karmaa organisaatioille. Julkisin varoin tuotetun datan avaaminen on lähtökohtaisesti hyvä teko organisaatiolta. Säästöihin voi aueta mahdollisuuksia, mikäli dataa hyödynnetään tai jalostetaan joukkoistamisen kautta.

Potentiaalisia menoeriä ovat tekijänoikeusriski, mikä voi realisoitua, jos avattu data sisältää tekijänoikeuden suojaamaa materiaalia. Datan avaaminen todennäköisesti tuo muassaan uusia työtehtäviä ja lisää työn määrää organisaatiossa.

Avoimen datan ansaintalogiikka

Levän mukaan kestävää on se, että asiakas maksaa jotain. Käytännössä tämä voisi mennä kuvatietokantojen osalta niin, että julkaistaan metadata avoimena ja otetaan maksu varsinaisesta kuvasta. Avoimen datan positiivisista yhteiskunnallisista vaikutuksista puhutaan. Miten saadaan tasattua yhteiskunnan saamat lisätulot avoimesta datasta ja organisaatioille koituvat menot avoimesta datasta, jos esimerkiksi museolle datan avaus maksaa X euroa ja yhteiskunta saa tuloja X euroa?

 

Avoimen datan mahdollisuuksista museossa

Kimmo Antila (Postimuseo) kysyi puheessaan käyttäjyyden ja datan hyödyntämisen perään. Datan avaamisessa(kin) pitäisi miettiä käyttäjyyttä eli kenelle näitä juttuja tehdään. Hyvä kysymys, onko avoin data itseisarvo vai itseasiassa kontekstuaalinen, kuratoitu tieto? Antila korosti kuratoinnin ja analysoinnin tärkeyttä. Datan avaamisen lisäksi organisaation pitäisi analysoida ja tulkita dataa.

Kokeiluja voi tehdä jo olemassa olevilla avoimeen dataan pohjautuvilla työkaluilla. Esimerkiksi Mediawikiä ja Wikipediaa voidaan hyödyntää erilaisten tietovarantojen ja oman osaamisen esilletuonnissa. Näin esimerkiksi tehtiin Rupriikin järjestämässä wiki-työpajassa 9.11.2013.

Tärkeää olisi näyttelyjen ohessa lisätä/parantaa jo olemassa tietoa: kun kokoelmia tuodaan esiin, olisi hyvä pyrkiä samalla lisäämään tietoa ko. aiheesta. Erilainen tutkijayhteistyö näyttelyiden osalta on tärkeää; tästä oli kyse esimerkiksi Inventing Europe -hankkeessa. Joukkoistamista datan rikastamisessa on tutkinut Ari Häyrinen väitöskirjassaan Open sourcing digital heritage : digital surrogates, museums and knowledge management in the age of open networks.

Kimmo Antila asetti datan avauksen hienoksi tavoitteeksi synnyttää uutta luovaa, vuorovaikutteista ja kaikkia osapuolia hyödyttävää tietoa.

Hakukone kuin henkivoima

Vierailuprofessuuriaan Helsingin yliopiston tutkijakollegiumissa hoitava John Durham Peters piti luennon Tampereen yliopistolla. Luennon otsikko oli God and Google, ja itse luento oli yhtä lennokas kuin otsikkokin. Mielikuvitusta kutittava ja mainio.

Peters puhui Googlen toimintatavoista ja hakujätin herättämistä mielikuvista. Google toimi eräänlaisena tapausesimerkkinä digitalisaatiosta ja digitalisaation aiheuttamista muutoksista. Luento pohjautui osaksi Petersin pian julkaistavaan teokseen.

Yksi luennon pääteemoista oli ajatus siitä, että Google on luonut enempi vähempi tarkoituksellisesti itsestään mielikuvaa eräänlaisena jumalallisena, kaikkivoipaisena toimijana. Luennossaan Peters analysoi puhetapoja, joilla yritystä käsitellään, ja vertauskuvia, joita yrityksestä esitetään.

Mielikuvien rakentamisessaan Google on luonut kuvaa itsestään muista poikkeavana yrityksenä. Esimerkkinä tästä Peters mainitsi yrityksen moton:

”Don’t be evil.”

Google on ollut liikemaailman Barack Obama, ja kuten Obama on osoittanut omaavansa peruspoliitikon ominaisuuksia, myös Googlesta on paljastunut perusliikeyritykselle tyypillisiä piirteitä. Kaikkivoipainen hyvyys ei ole ainoa totuus niin Obamasta kuin Googlestakaan.

Yritystä käsittelevistä puhetavoista on erotettavissa teologista diskurssia. Peters nosti yhdeksi esimerkiksi tällaisesta diskurssista Googlen toisen perustajan Sergei Brinin kuvauksen hakukoneesta:

”The perfect search engine would be like the mind of God.”

Peters näkee tämän yhdeksi tavaksi rakentaa Googlesta eräänlaista jumalallista entiteettiä.

Google autocomplete Toisena esimerkkinä hän käytti hakukoneiden käyttämää autocomplete-toimintoa hakukentässä. Tiedonhakijan kirjoittaessa hakutermejään tämä toiminto ehdottaa – tai ennakoi – potentiaalisia hakutermejä.

Kaikkivoipaisuuden tavoitteluksi on tulkittavissa myös Googlen missio organisoida kaikki maailman informaatio:

”Google’s mission is to organize the world’s information and make it universally accessible and useful.” (lähde)

Tälle tavoitteelle Peters näki paralleeleja kirjoitustaidon synnyn ja tarpeen kanssa. Yhtenä kirjoitustaidon taustalla vaikuttavana tarpeena oli kirjanpito, jolla pidettiin kirjaa omaisuudesta. Kirjanpidoksi koottu data merkitsi valtaa, ja valtaa data eri muodoissa merkitsee edelleen.

Peters tulkitsee Googlen rakentavan tällaista kirjanpitoa organisoidessaan ”kaiken maailman informaation”. Se jäljittää henkilöitä, ajatuksia, globaaleja trendejä, kuten flunssatautiaaltoja. Se indeksoi ihmisten kiinnostuksen kohteita ja mielitekoja. Googlen haravoima data kertoo ihmisestä ja ihmisistä, ja hakuindekseineen Google voidaan nähdä jopa modernin ajan elämän kirjana (book of life). Indeksointityöhön liittyy olennaisena osana Internetistä maalattu uhkakuva tai ominaisuus (miten sen nyt ottaa), jonka mukaan kerran nettiin laitettua kuvaa/tekstiä/mitä tahansa ei saa sieltä pois.

Indeksointityössään se ei Petersin mukaan järjestä informaatiota siihen tapaan kuin kirjastot, joilla on esimerkiksi luokitusjärjestelmänsä (kuten yleisten kirjastojen luokitusjärjestelmä) ja luettelointisääntönsä. Aineistojen ja sisältöjen sijaintitieto on kirjastoille tärkeää. Google ei edes yritä tätä, koska Internetissä tarpeet ovat toisenlaiset. Googlen toiminnassa on tapahtunut muutoksia myös siinä, että aiemmin Google pääasiassa organisoi toisten tuottamia sisältöjä. Ajan oloon Google on tullut mukaan myös sisällöntuottobisnekseen.
Google-logoja
Huolimatta vakavaotsaisista tavoitteistaan Google ei ole tosikko: yritys esimerkiksi leikittelee eri tavoin logollaan. I’m feeling lucky -hakutoiminto on toinen esimerkki leikittelystä. Sen olemassa ololle ei löydy taloudellisessa mielessä järkevää syytä: toiminto vie tilaa hakusivulla eikä tuo rahaa Googlelle. Toimintoa käyttää Petersin mukaan noin prosentti tiedonhakijoista.

Kritiikki

Luennon lopuksi Peters purki mielikuvia Googlesta

  • Google ei ole kaikkitietävä (omniscient): Suurin osa maailmasta tai historiasta ei ole netissä. Sieltä ei löydy kaikki maailman informaatio.
  • Google ei ole kaikkialla läsnä (omnipresent): Internet ja sen myötä Google ei ulotu kaikkialle maailmassa.
  • Google ei ole pelkkä hyväntekijä (omnibenevolent): kyse on liikeyrityksestä, jonka yhtenä tehtävänä on tuottaa voittoa osakkeenomistajille. Googlen toiminta Kiinassa oli arveluttavaa suhteessa yrityksen mottoon.

Googlella on hakukonemarkkinoiden monopoli, ja monopoleissa on omat riskinsä. Ulkopuoliset eivät esimerkiksi tunne Googlen hakualgoritmejä, joiden perusteella hakutulokset tarjoillaan. Tässä kritiikissään Peters on samoilla jäljillä Evgeny Morozovin, joka teoksessaan To save everything, click here on huolestunut verkkopalveluista, joiden toiminta perustuu ulkopuolisilta salattuihin algoritmeihin.

Peters nosti esiin Googlen monimuotoisuuden. Se ei ole enää vain hakukone. Esimerkiksi Google-lasit ja robottiautoteknologiakokeilut kertovat siitä, että yrityksellä on kunnianhimoa laajentaa toimialaansa tiedonhakua laajemmalle. Googlen toiminnassa on kyse yhä enemmän analytiikasta. Googlehan on ollut osaltaan rakentamassa Big Data -trendiä ja kehittämässä tiedonlouhintamenetelmiä, esimerkiksi MapReduce. Data-analytiikka on nouseva ala, ja Peters haastoi kuulijoitaan ns. ottamaan haltuun teknologiaa. Teknologioita ja niiden toimintaperiaatteita tulisi pyrkiä ymmärtämään ainakin jollain yleisellä tasolla. Teknologista kehitystä ei saisi jättää monopolien varaan.

Unohdetuksi tuleminen autuus?

Peters veti luennon yhteen viittauksella Konfutseen, Jeesukseen ja Sokrateehen. Mikä oli näille kolmelle henkilölle yhteistä? Petersin mukaan ainakin se, että he eivät jättäneet kirjallista perintöä. Sokrates näki kirjoittamisen hyvin ongelmalliseksi, suorastaan pahaksi. Petersin hypoteesi sille, miksi nämä henkilöt kieltäytyivät kirjoittamasta doktriinejaan, on tämä: heidän viestinsä meille oli, että totutelkaa ajatukseen omasta kuolemasta. Katoamme joskus ja se voi olla yksi parhaimpia asioita, mitä meille voi tapahtua. Google on matkalla toimijaksi, joka päättää, mitkä asiat katoavat ja mitkä eivät.

Editoitu 1.2.2014

Googlesta ja sen roolista kirjoittaa Oskari Onninen uusimmassa Imagessa 2/2014: Jumala. Juttu löytyy myös Readberrystä.

Kokemuksia kokoelmadatan avaamisesta Valtion taidemuseossa

Sanna Hirvonen kertoi Valtion taidemuseon datanavausprosessista. Avauksen kohteena oli kolmen museon hallinnoimien taideteosten metadata. Lisenssinä oli CC0 ja tiedot tulivat Muusa-järjestelmästä. Avauksesta on myös Piia Laitan tiedote Data on auki. Datan avaamisen toivotaan tarjoavan uusia kosketuspintoja ja näkökulmia sisältöihin.

Data on tarjolla sekä rajapinnan kautta että datapakettina (DC-XML-, DC-JSON- ja DC-TEXT-muodossa. API-konsolilla voi testata rajapinnan toimintaa. Muusassa data on rakenteistettu Lightweight Information Describing Objects (LIDO) -skeeman mukaisesti, mutta datadumpit on myllytetty Dublin Core -formaattiin. Syynä tähän on ilmeisesti se, että DC on LIDOa yleisempi.

Datan avauksen työvaiheita olivat

  1. päätös avaamisesta
  2. rajapinnan toteutus, jonka teki Grip Studios Interactive
  3. tiedottaminen ja tiedon jakaminen
  4. ideoiden ja palautteen kerääminen käyttäjiltä. Tätä varten Kiasma järjesti data-työpajan 23.10.2013.

Työpajassa ideoitiin muun muassa mihin museodataa voisi yhdistää. Tarjokkaiksi nousivat muun muassa paikkatieto, aikatieto ja kirjastodata.

Työpajassa esitettiin myös hyviä kysymyksiä: Miten tuoda esiin dataa hyödyntävät sovellukset? Miten vastataan kehittämisehdotuksiin? Miten käyttäjien tuottamaa rikastavaa  dataa hyödynnetään ja liitetäänkö tämä rikaste osaksi ns. master-dataa eli tässä tapauksessa osaksi Muusassa olevaa metadataa? Oman datan käyttöä kannattaa seurata ja millaisia dataa hyödyntäviä sovelluksia syntyy.

Seuraavaksi dataa avanneilla museoilla on työn alla kerätä esimerkkejä datan hyödyntämisestä, virittää yhteistyötä muiden tiedontarjoajien kanssa, kehittää tarjolla olevaa dataa saatujen kokemusten ja palautteen pohjalta ja edetä pilottiprojektien kautta kohti avoimempaa lisenssiä.

Mitä on opittu? Ei kannata odottaa, että maailma on valmis. Sama nousi esiin Sanna Marttilan puheenvuorossakin. Datan ei tarvitse olla 100 % oikeaa ja virheetöntä. ”Likainen data” kelpaa sekin, jos muuta ei ole. Yhteistyöhön kannattaa hakeutua varhain mahdollisten käyttäjien kanssa. Kaikkea ei tarvitse osata itse: neuvoa voi kysyä eri foorumilta tai ostaa palveluja.