Museot ja avoin data -seminaaripäivästä

Museoliitto järjesti lokakuun 2013 lopulla seminaarin avoimesta datasta: Avoin data ja avoimet sisällöt museossa. Päivän aikana tehtiin aina tarpeellista käsitteiden määrittelyä (mitä on avoin data, avoin tieto, avoin sisältö ja avoimet palvelut) ja käytiin datan avausta esimerkkien kautta läpi. Hyvä päivä, hyviä esityksiä. Päivästä bloggasi aiemmin Kaisa Kyläkoski: Avoimesti saatua tietoa museoiden keskustelusta avoimuudesta. Kannattaa käydä lukemassa.

Hami Kekkonen kertoi Helsinki Region Infoshare -hankkeesta, jossa suomalaisittain pioneerihengessä haettu julkaistavaksi soveltuvaa dataa pääkaupunkiseudun julkishallinnolta. HRI:n pilottivaihe kesti 2010–2012 ja nyt vuosi 2013 on mennyt avoimen datan ja datan julkaisemisen vakiinnuttamisessa. Kekkosen mukaan pääkaupunkiseudulla datan avaamisesta tulee kuntien normaalia toimintaa vuoden 2014 aikana. Toimintaa ollaan siirtämässä Helsingin kaupungin tietokeskukseen.

Kuntien teknologisten valintojen tekemiseen HRI ei osallistu. Kunnat päättävät itse teknologioistaan esimerkiksi millaisia rajapintoja järjestelmiin rakennetaan.

Päivän esityksistä on tulossa muutamia merkintöjäni seuraavassa tahdissa:

Suomalaisen OA-julkaisemisen historiaa

Jyrki Ilva teki mainion katsauksen suomalaisen OA-julkaisemisen historiaan ja nykytilaan esityksessään ”Open repositories of past, present and future”.

Osa julkaisutoiminnan perustaa ovat julkaisuarkistot (institutional repository), joiden kehitykseen ovat vaikuttaneet erilaiset tekijät, kuten tutkimusten hallinnointiin ja arviointiin käytetyt järjestelmät (Current research information system, CRIS), väitöskirjojen ja opinnäytteiden digitalisoituminen, digitaalisten objektien hallintajärjestelmät (Digital Object Management Systems, DOMS), OA-julkaisutoiminta, green OA eli rinnakkaisjulkaiseminen ja avoin tutkimusdata. Perusero CRISin ja julkaisuarkiston välillä on se, että CRIS sisältää informaatiota kaikista tutkimusjulkaisuista, kun taas julkaisuarkisto sisältää tietoa OA-kokotekstijulkaisuista.

Green OA eli rinnakkaisjulkaiseminen tuli 2000-luvun alkupuolella. Lähtökohtana oli ajatus siitä, että kun OA-varantoja rakennetaan, tutkijat tulevat julkaistavien tutkimustensa kera perässä. Näin homma ei kuitenkaan toiminut, koska julkaisevilla tutkijoilla ei ollut ykkösprioriteettinään tiedon avoin saatavuus, open access. Rakennetut varannot olivat ns. pistemäisiä, tiettyyn tutkimusalueeseen keskittyviä, esim. ArXiv.

Julkaisuarkistojärjestelmät ja -alustat

Erääksi OA-liikkeen vaikutukseksi voidaan lukea se, että arkistojärjestelmien myötä avoimen lähdekoodin sovellukset lisääntyivät kirjastoissa. Arkistotoiminnan myötä syntyi tarve digitaalisten objektien hallintajärjestelmille ja tuolloin järjestelmäntoimittajilta ei löytynyt sopivia tuotteita. Käytetyimpiä alustoja olivat esimerkiksi DSpace, Fedora ja Eprints.
Pohjoismaissa lähes kaikilla yliopistoilla on julkaisuarkisto ja julkaisujen määrä kasvaa. Suomessa Kansalliskirjasto tarjoaa 40 instituutiolle julkaisuarkisto-palvelua. Arkistopalvelut ovat käytettyjä, mikä johtuu muun muassa hyvästä hakukonenäkyvyydestä.

Julkaisuarkistot eivät saisi olla yksinäisiä saaria, vaan niillä tulee olla integraatiota esimerkiksi CRIS-järjestelmien välille. Esimerkiksi Tanskassa useat yliopistot käyttävät Pure-alustaa ja Ruotsissa DiVA-alustaa molempiin tarkoituksiin: sekä julkaisuarkistona että CRIS-järjestelmänä. Suomessa julkaisuarkistot ja CRIS-järjestelmät ovat enimmäkseen erillisia systeemejä. Yliopistoilla on menossa CRIS-infrastruktuurin päivitys.

Avoin tutkimusdata

Tutkimusten julkaisemisen ohella uutena osa-alueena on tulossa tutkimusdatan julkaiseminen. Pohdinnan alla on aiheuttaako tutkimusdatan julkaiseminen muutostarpeita julkaisuarkistoihin. Millaisia yhteyksiä eri tutkimusten ja tutkimusaineistojen välille voidaan luoda?

Pohdinnassa on myös se, onko OA:n tulevaisuus kirjastojen, kustantamoiden vai molempien toimijoiden ylläpitämissä julkaisuarkistoissa? Ylipäätään mikä on tulevaisuudessa julkaisuarkistojen rooli kirjastopalveluissa? Onko tarkoituksena tarjota saataville omassa organisaatiossa tuotettuja dokumentteja vai tarjota paikallisille käyttäjille muualla tuotettuja dokumentteja? Mikä tulee olemaan julkaisuarkistojen suhde tutkijoille tarkoitettuihin pilvipalvelupohjaisiin sosiaalisiin verkostoitumispalveluihin, kuten Academia.edu ja Mendeley.

OA-julkaisemiseen liittyvästä kritiikistä

Lis Ferla, 327 of 365: Everyone's A Critic http://www.flickr.com/photos/lastyearsgirl_/2581843770/
Lis Ferla, 327 of 365: Everyone’s A Critic http://www.flickr.com/photos/lastyearsgirl_/2581843770/

Johanna Lilja (”Do Open Access journals qualify?”) pohti avoimeen saatavuuteen liittyvää kritiikkiä ja ongelma-alueita OA-julkaisemisessa. Yksi puurojen ja vellien sekoittumispaikka on muun muassa OA-julkaisujen sekoittaminen bloggaukseen ja Wikipediaan. Julkaisupuolella open access -julkaisujen mainetta pilaavat OA-julkaisujen liiketoimintamallia väärinkäyttävät kausijulkaisut (ns. predatory journal). Nämä julkaisut houkuttelevat tutkijoita julkaisemaan artikkeleitaan ja perivät tutkijoilta julkaisumaksun sillä lupauksella, että artikkelit vertaisarvioidaan ja editoidaan, vaikka näitä julkaisuprosessin vaiheita ei toteutetakaan.

Julkaisutoiminnassa voi ilmetä muutakin ongelmaa. Lilja esitteli John Bohannonin tutkimuksen ”Who’s afraid of peer review”, jonka tutkimuskohteena olleista OA-julkaisuista osassa laaduntarkkailu petti pahasti ja julkaistavaksi päätyi artikkeli, jossa oli pahoja virheitä.

Lääkkeenä vaivaan voisi olla erilaiset laatumerkinnät, joilla julkaisu voi osoittaa sitoutumisensa vertaisarviointiprosessiin, kuten esimerkiksi Guaranteed Peer Reviewed Content (GPRC).

Suomen tavoitteiksi Lilja tarjoaa selkeää merkintää, jolla vertaisarvioitu artikkeli erotetaan arvioimattomasta. OA-julkaisujen liiketoimintamallia väärinkäyttävien julkaisujen (predatory journals) tunnistaminen ja siivoaminen pois julkaisuarkistoista, kuten DOAJ:ista. Kustantajien kannustaminen arviointikäytäntöjen laadun parantamiseen ja läpinäkyvyyteen.

OA-julkaisemiseen liittyvästä kritiikistä

Johanna Lilja (”Do Open Access journals qualify?”) pohti avoimeen saatavuuteen liittyvää kritiikkiä ja ongelma-alueita OA-julkaisemisessa. Yksi puurojen ja vellien sekoittumispaikka on muun muassa OA-julkaisujen sekoittaminen bloggaukseen ja Wikipediaan. Julkaisupuolella open access -julkaisujen mainetta pilaavat OA-julkaisujen liiketoimintamallia väärinkäyttävät kausijulkaisut (ns. predatory journal). Nämä julkaisut houkuttelevat tutkijoita julkaisemaan artikkeleitaan ja perivät tutkijoilta julkaisumaksun sillä lupauksella, että artikkelit vertaisarvioidaan ja editoidaan, vaikka näitä julkaisuprosessin vaiheita ei toteutetakaan.

Julkaisutoiminnassa voi ilmetä muutakin ongelmaa. Lilja esitteli John Bohannonin tutkimuksen ”Who’s afraid of peer review”, jonka tutkimuskohteena olleista OA-julkaisuista osassa laaduntarkkailu petti pahasti ja julkaistavaksi päätyi artikkeli, jossa oli pahoja virheitä.

Lääkkeenä vaivaan voisivat olla erilaiset laatumerkinnät, joilla julkaisu voi osoittaa sitoutumisensa vertaisarviointiprosessiin, kuten esimerkiksi Guaranteed Peer Reviewed Content (GPRC).

Suomen tavoitteiksi Lilja tarjoaa selkeää merkintää, jolla vertaisarvioitu artikkeli erotetaan arvioimattomasta. Asiattomien julkaisujen (predatory journals) tunnistaminen ja siivoaminen pois julkaisuarkistoista, kuten DOAJ:ista. Kustantajien kannustaminen arviointikäytäntöjen laadun parantamiseen ja läpinäkyvyyteen.

CRIStin, PASTEUR4OA ja OpenAIRE

Nina Karlstrøm esitteli norjalaista CRIStin (Current research information system in Norway) -palvelua, johon kootaan informaatiota norjalaisista tutkimuksista (”Bridge over troubled water – using the CRIS in building Open Access infrastructures”). CRISistä on rakennettu yhden luukun palvelua, jonka kautta pääsee käsiksi sekä metadataan että julkaistujen tutkimusartikkeleiden kokoteksteihin.

Palvelu jakaantuu moduuleihin: Julkaisutietokannassa (The Norwegian Science Index, NVI) on tallennettu tietoja tutkimusjulkaisuista. Tutkijarekisterissä on tietoja tutkijoista, kuten tiedot yhteystiedot ja ansioluettelo. Omissa moduuleissaan on tietoja tutkimusprojekteista, joita on käynnissä eri CRIStiniin kuuluvissa tutkimusyksiköissä, ja tutkimusyksiköistä, jotka kuuluvat CRIStiniin.

Palvelussa kerätään informaatiota tutkimustoiminnasta ja julkaisuista, hankitaan lisenssejä erilaisiin aineistoihin ja edistetään open access -julkaisemista.

CRIStin on suhteellisen uusi toimija. Palvelu on perustettu tammikuussa 2011 ja sen omistaa tutkimus- ja opetusministeriö. Mukana on myös terveysministeriö.

Kehityssuunnitelmissa panostetaan teknisen alustan kehittämiseen ja strategiatyöhön. CRIStinissä panostetaan tieteellisten artikkelien rinnakkaisjulkaisemiseen avoimissa julkaisuarkistoissa (ns. ”green road to open access”). Yhteyksiä rakennetaan CRISistä tutkimusyksiköiden omiin tietovarantoihin. Hakutuloksissa tarkoitus on yhdistää kokonaisvaltaisesti CRISin ja paikallisten tietovarantojen tuloksia. Tutkimusyksiköiden kanssa luodaan yhteistyökuvioita tiedonvaihdon osalta: keskenään vaihdetaan metadataa ja auktoriteettitietoja. Kehitteillä on myös mittareita, joilla voitaisiin mitata open access – julkaisemisen vaikutusta.

Strategiatyössä on tavoitteena promotoida tiedon avointa saatavuutta eri yhteiskunnallisilla tasoilla.

Pasteuria monessa formaatissa. roboppy, New Pasteur,  http://www.flickr.com/photos/roboppy/436056250/sizes/m
Pasteuria monessa formaatissa. roboppy, New Pasteur, http://www.flickr.com/photos/roboppy/436056250/sizes/m

EU:ssa on tulossa ja menossa erilaisia OA-hankkeita. Karlstrøm mainitsi vuoden 2014 alkupuolella käynnistyvän PASTEUR4OA-hankkeen. Hankkeessa on tarkoituksena edistää tiedon avointa saatavuutta, sitouttaa poliittisia päättäjiä open access -toimintaan ja tukea politiikkaa, jossa kehitetään tutkimusten ja datan avointa saatavuutta.

Mikael K. Elbæk Tanskan teknillisestä yliopistosta (”How is OpenAIRE supporting open access policies and infrastructures in Europe? A Nordic point of view!”) puolestaan esitteli OpenAIRE-hanketta. EU:ssa on eritasoilla luotu maaperää OA-julkaisemiselle ja avoimelle tutkimustoiminnalle lähtien Neelie Kroesin näkemyksestä, että OA on edellytys EU kilpailukyvylle, ja päätyen vuonna 2014 käynnistyvään Horizon 2020 -innovaatio-ohjelmaan.

OpenAIRE-hankkeen tavoitteet ovat

  • kehittää julkaisurakenteita, jotka mahdollistavat sekä helpomman OA- julkaisemisen EU-rahoitteisille tutkimusartikkeleille että artikkeleiden vaikuttavuuden tarkkailun
  • perustaa infrastruktuuri, jonka avulla voidaan hallinnoida muun muassa vertaisarvioituja artikkeleita ja konferenssijulkaisuja
  • selvittää tutkimusdatasettien hallintaan liittyviä vaatimuksia, työprosesseja, käytänteitä ja datamalleja jne.

Kyse on monitieteisestä hankkeesta, jossa mitataan myös tutkimusten vaikuttavuutta.

Projektin ensimmäisessä vaiheessa (2009–2012) tavoitteena oli linkittää toisiinsa tietyt julkaisut ja tietyt projektit. OpenAIREplus-vaiheessa (2011–2014) tavoitteena on levittää OA-julkaisemista laajemmalle Eurooppaan ja yhdistää tutkimusprojektit, tutkimusjulkaisut ja tutkimusdata.

Open Access Ruotsissa: rahoitusmalleja, OA-tietokantoja ja -hankkeita

Ulf Kronman esitteli OA-rintaman tilannetta Ruotsissa ja Ruotsin kansalliskirjaston roolia tiedon avoimen saatavuuden edistämisessä (”Open Access in Sweden and the programme OpenAccess.se”). Ruotsalaista OA-historiaa esittelee myös Jan Hagerlid (2006) artikkelissaan ”Open Access in Sweden 2002–2005”.

Kansalliskirjastolla on kolme vastuualuetta:

  • ruotsalaisen kulttuuriperinnön säilyttäminen
  • tutkimuskirjastotoiminnan ylläpito humanistisille tieteille ja
  • ruotsalaisten tieteellisten ja yleisten kirjastojen toiminnan koordinointi.

Kansalliskirjaston koordinointivastuulle kuuluu LIBRIS-yhteisluettelo ja BIBSAM-konsortio, joka hankkii lisenssejä sähköisiin aineistoihin. Koordinointiin kuuluu myös erilaiset kehittämishankkeet, ja tähän kehittämistyöhön istuu myös open access -toiminta.

Ensimmäisiä askeleita otettiin vuonna 2003: Lundin yliopiston kirjasto perusti Directory of Open Access Journals (DOAJ) -palvelun ja BIBSAMin rahoittamana aloitettiin tieteellisten yliopistojen Samordning av den Svenska Högskolans Elektroniska Publicering (SVEP) – projekti, jonka tavoitteena oli kansallisella tasolla koordinoida ja edistää elektronista julkaisua korkeakouluissa. SVEP antoi muun muassa sisällönkuvailua koskevia suosituksia.

Swedish Association of Higher Education (SUHF) perustaman komitean raportti ”Pathways to Knowledge : the need for a common new strategic orientation for universities and their libraries” avasi ruotsalaiselle tiedemaailmalle kansainvälistä open access – keskustelua. Raportissa esitettiin tarve uudistaa silloista tiedejulkaisemista: yliopistojen tuli tarjota ammattimaisia julkaisupalveluja ja yliopistoille piti toisaalta tarjota taloudelliset edellytykset tällaiselle toiminnalle. Vuonna 2004 SUHF allekirjoitti Berlin Declaration on OA -asiakirjan. Vuonna 2005 SUHF antoi suosituksen open access -julkaisemisesta jäseninstituutioilleen.

Vuonna 2006 Ruotsin kansalliskirjasto käynnisti OpenAccess.se-hankkeen. Projektin tavoitteena oli edistää ruotsalaisten tutkijoiden, opettajien ja opiskelijoiden töiden vapaata saatavuutta. Alkuun kyse oli projektista (2006–2009). Tämän jälkeen toiminta vakinaistettiin. Hankkeessa järjestetään muun muassa koulutusta ja seminaareja, ylläpidetään SwePub-julkaisukatalogia ja osallistutaan EU:n OpenAIRE-projektiin.

Kansallista open access -linjausta kohden liikuttiin viime vuonna julkaistussa Ruotsin hallituksen lakialoitteessa (Forskning och innovation) kaudelle 2013–2016. Tiedon avoimen saatavuuden osalta lakialoitteen merkittävimpiä kohtia on ehdotus, että Ruotsin tiedeneuvosto kehittäisi kansallisen ohjeistuksen tieteellisen informaation vapaalle saatavuudelle. Kansalliskirjastolle vastuutetaan ehdotuksessa tiedeneuvoston tukeminen tiedon avoimen saatavuuden parantamisessa.

OpenAccess.sen rooli on Kronmanin mukaan muuttumassa enemmän suorittavaksi: miksi- kysymysten sijaan mietitään enemmän kuinka-kysymyksiä.

Ruotsalaiset julkaisuarkistot

Järjestelmäkentän puolella löytyy elonkirjoa. Tällä hetkellä 33 yliopistoa on mukana DiVA-konsortion järjestelmässä. Kahdellatoista korkeakoululla on stand-alone- järjestelmät: DSpacea, EPrintsiä, itserakennettuja, Avedas-yhtiön Converis-järjestelmää ja tanskalaisen Atiran aikoinaan kehittämää Pure-järjestelmää (Elsevierin tekemän yhtiökaupan jälkeen Atira siirtyi Elsevierille ja Pure sulautettiin osaksi SciValia). Kansalliskirjaston ylläpitämä SwePub-julkaisutietokantaan haravoidaan julkaisutietoja paikallisista tietokannoista.

Kronmanin mukaan yleisesti ottaen kehityksen suunta on ollut se, että alkuvaiheessa disseminaatio korostui, nyt paino on siirtymässä tilastoihin ja niiden tulkintaan. SwePubin datan bibliometristä hyödyntämistä kehitetään. Potentiaalisia hyödyntäjiä ovat esimerkiksi sekä Ruotsin tiedeneuvosto ja sen PRISMA-järjestelmä että SweCRIS.

Rahoitusmalleista

Jörgen Eriksson esitteli Lundin yliopiston kokemuksia rahoitusmallista, joka perustuu artikkelien käsittelymaksuun (Article Processing Charges, APC).

Rahoitusmallissa artikkelin kirjoittaja maksaa artikkelinsa julkaisukulut ja lukijalle artikkeli on maksuton. Erikssonin mukaan 29 %:a DOAJ:n julkaisuista käyttää APC:ta Käytännössä rahoitus voi tulla esimerkiksi yliopistoilta. Ruotsissa Lundin ja Chalmersin yliopisto tukevat OA-julkaisua myöntämällä rahaa APC-kuluihin.

Jan Erik Frantsvåg (”Our publication fund – what have we learnt?”) esitteli Tromsøn yliopistosta sääntöjä OA-julkaisujen rahoittamiselle. Rahoituksen ehtoina on muun muassa se, että kausijulkaisu on DOAJ:issa ja että kausijulkaisu on akkreditoitu NSD:ssa (Norsk samfunnsvitenskapelig datatjeneste).

Terveystieteelliset ja biotieteelliset tutkimukset saavat tilastojen mukaan useimmin rahoitusta. Humanistiset tieteet, sosiaali- ja kasvatustiede eivät ole saaneet juurikaan. Rahoitus kasvaa suhteellisesti nopeammin kuin OA-julkaisu. Mahikset saada rahoitusta OA-julkaisulle siis paranevat.
Tromsøssä OA-julkaisun määrä on noussut selkeästi 2010–2012.