Open Access-publicering vid svenska lärosäten – en kartläggning av året 2011 Projektrapport till Kungliga biblioteket April 2014 Margareta Fathli, KTH Biblioteket Tomas Lundén, Göteborgs universitetsbibliotek Peter Sjögårde, KTH Biblioteket 2 Innehåll 1 Sammanfattning .................................................................................................................. 5 2 Inledning ............................................................................................................................. 6 2.1 Bakgrund och syfte ...................................................................................................... 6 2.2 Projektinformation ........................................................................................................ 6 2.3 Begrepp och definitioner .............................................................................................. 7 3 Tidigare studier ................................................................................................................... 9 4 Data och metod..................................................................................................................13 4.1 Datakällor ...................................................................................................................13 4.2 Undantag av dataunderlag och manuella tillägg ..........................................................15 4.3 Analys av Swepub-data ..............................................................................................15 4.4 Manuell sökning av slumpvis urval av 1000 poster......................................................17 5 Resultat .............................................................................................................................17 5.1 Resultat för samtliga lärosäten sammantaget .............................................................17 5.2 Resultat för slumpvis urval om 1000 artiklar ................................................................19 5.3 OA-tidskrifter ...............................................................................................................21 5.4 Möjlig OA-publicering enligt SHERPA/RoMEO ...........................................................23 6 Diskussion .........................................................................................................................26 6.1 Definition av OA ..........................................................................................................26 6.2 ”Tipping point”? ...........................................................................................................27 6.3 Rekommendationer för framtida mätningar av svensk OA-publicering ........................28 7 Referenser .........................................................................................................................30 8 Appendix ............................................................................................................................33 8.1 Resultat uppdelat per lärosäte ....................................................................................33 8.2 Resultat per ämne.......................................................................................................38 3 Tabellförteckning Tabell 1: Översikt över senare års studier över andel OA. ........................................................................................ 12 Tabell 2: Antal och andel av samtliga artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd OA. Tabellen visar även överlappet mellan de olika kategorierna. .......................................... 18 Tabell 3: Antal och andel av samtliga artiklar från 2011 som finns tillgängliga open access, överlapp borträknat. .......................................................................................................................................................................... 18 Tabell 4: Antal och andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access. .................... 19 Tabell 5: Antal och andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access, uppdelat på guld, grön, fördröjd och annan open access. ................................................................................................................ 20 Tabell 6: Kategorin ”annan OA” i urvalet om 1000 artiklar från 2011, uppdelad efter plats för open access- publicering. ......................................................................................................................................................................... 21 Tabell 7: Lista på open access-tidskrifter i DOAJ som svenska forskare mest frekvent publicerat sig i 2011. . 21 Tabell 8: Lista på de tidskrifter med fördröjd open access som svenska forskare mest frekvent publicerat sig i 2011. .................................................................................................................................................................................... 22 Tabell 9: Antal och andel artiklar från 2011 med ISSN och villkorsuppgifter i SHERPA/RoMEO. ................ 23 Tabell 10: Antal och andel artiklar från 2011 med villkorsuppgifter i SHERPA/RoMEO som har parallellpublicerats. ............................................................................................................................................................ 25 Tabell 11: Antal och andel artiklar från 2011 som finns tillgängliga open access redovisat per lärosäte............ 33 Tabell 12: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. ......................................................................................................................... 34 Tabell 13: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. ......................................................................................................................... 35 Tabell 14: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. ................................................ 38 Tabell 15: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. ................................................ 39 Tabell 16: Antal artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science- Metrix tidskriftklassifikation. ........................................................................................................................................... 42 Tabell 17: Andel artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science- Metrix tidskriftklassifikation. ........................................................................................................................................... 43 Tabell 18: Översikt över senare års studier över andel OA. ...................................................................................... 45 4 Figurförteckning Figur 1: Venn-diagram över de olika kategorierna av open access och hur ett ungefärligt överlapp kan tänkas se ut. ...................................................................................................................................................................................... 8 Figur 2: Andel av samtliga artiklar från 2011 som finns tillgängliga open access. .................................................. 19 Figur 3: Andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access. ....................................... 20 Figur 4: Andel artiklar från 2011 med ISSN och med villkorsuppgifter i SHERPA/RoMEO. .......................... 23 Figur 5: Villkor för de 20371 artiklarna från 2011 med villkorsuppgifter i SHERPA/RoMEO. ........................ 24 Figur 6: Antal artiklar som har parallellpublicerats av samtliga 20371 artiklar från 2011 med villkorsuppgifter i SHERPA/RoMEO. ......................................................................................................................................................... 25 Figur 7: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. ................................................................................................................................... 36 Figur 8: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. ................................................................................................................................... 37 Figur 9: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. .......................................................... 40 Figur 10: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. .......................................................... 41 Figur 11: Antal och andel artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science-Metrix tidskriftklassifikation. ............................................................................................................................ 44 5 1 Sammanfattning Syfte: Syftet med projektet har varit att undersöka hur stor del av den svenska forskningen som har publicerats open access under publiceringsåret 2011. Vi har studerat den totala andelen open access- publikationer, både så kallad guld och grön open access, dels nationellt och dels per lärosäte. Vi har också velat undersöka hur stor andel av artiklarna i vårt underlag som skulle kunna parallellpubliceras enligt SHERPA/RoMEO, men där så inte skett. Ett vidare syfte har även varit att ta fram metodik för att skapa förutsättningar för framtida mätningar av svensk OA-publicering. Data och metod: Den svenska nationella publikationsdatabasen Swepub har använts som primärkälla för undersökningen. Begränsning gjordes till refereegranskade artiklar och forskningsöversikter. Swepub innehåller även länkar till parallellpublicerade fulltextfiler, och används i studien även som källa för grön OA. För KI och SLU, som i nuläget inte levererar publikationsdata till Swepub, försågs projektet med data direkt från respektive lärosäte. Datauttaget matchades mot DOAJ för att få fram andelen guld OA. Samtlig statistik räknades ofraktionaliserat. På lärosätesnivå räknades grön OA-publicering endast om fulltextlänk i Swepub kom från lärosätets egna arkiv. Utöver den maskinella undersökningen gjordes också ett urval om 1000 slumpvis utvalda poster från den undersökta publikationsmängden för manuell genomgång. Artiklarna söktes upp manuellt i Google och i Google Scholar. Sökningarna gjordes på titel och endast resultat på första träffsidan i respektive sökmotor kontrollerades. För statistik om de villkor som förlagen ställer angående parallellpublicering användes SHERPA/RoMEO. Det är problematiskt att dela in förlagsvillkoren i tydligt avskilda kategorier på grund av den stora variationen. Kategoriseringen ger dock en uppfattning om i vilken utsträckning som artiklarna i undersökningen kan parallellpubliceras. Resultat: För samtliga lärosäten sammanräknade var drygt 10 procent av artiklarna från 2011 publicerade i OA-tidskrifter. Parallellpublicerade artiklar (i svenska lärosätens institutionella arkiv) uppgår till nästan samma siffra, knappt 10 procent. Tre procent av artiklarna är både publicerade i en OA-tidskrift och parallellpublicerade, dvs överlappande, vilket innebär att det totala resultatet hamnar på 17 procent. Räknar man även med så kallad fördröjd OA på tidskrifters egna hemsidor, uppgår totalsiffran till drygt 25 procent. Den manuella undersökningen visade att av de publikationer som inte ingår i kategorierna grön och guld OA så kunde 27,5 procent återfinnas fritt tillgängliga någon annanstans. Den totala andelen OA var här 52,2 procent. För möjlig parallellpublicering fann studien att 59 procent av artiklarna kan parallellpubliceras enligt SHERPA/RoMEO. Endast 2 procent kunde inte parallellpubliceras överhuvudtaget och 36 procent kunde parallellpubliceras men med restriktioner. Diskussion: Studien frammanar en bild där OA-publiceringen har antagit varierande former och tillgängliggörandet av vetenskapliga artiklar sker på många olika sätt. Flera av publiceringsvägarna går att ifrågasätta utifrån Berlindeklarationens definition av OA. Det är önskvärt med en ökad standardisering av vad som bör mätas. Projektets rekommendationer för framtida mätningar av OA i Sverige är att för grön OA inte medräkna fritt tillgängliga artiklar utanför etablerade arkiv. Dessa artiklar har inte tillgängliggjorts inom en etablerad infrastruktur med säkerställd beständighet och interoperabilitet. Frågetecken kan även sättas för kategorin fördröjd OA. 6 2 Inledning Open access-frågan har fått stor internationell uppmärksamhet under de senaste åren. Öppna institutionella arkiv finns idag på nästan varje lärosäte världen över och antalet open access-tidskrifter ökar konstant. Fokus ligger inte längre på frågan om huruvida open access är bra eller dåligt, istället fokuserar diskussionen på vilken väg till open access som är mest fördelaktig, ekonomiskt och för forskningens spridning och genomslagsmässigt. EU förväntar sig att dess medlemsländer skriver nationella policies angående open access till vetenskapliga publikationer1 och först ut med sådana är Storbritannien och Irland. Storbritannien har valt att förorda den gyllene vägen medan Irland har valt den gröna vägen.2 Inte bara i Europa diskuteras OA-policies på nationell nivå. I USA har Vita huset gett de amerikanska statliga finanisärerna i uppdrag att ta fram policies som kräver open access till den forskning som de finansierar.3 I Sverige har Vetenskapsrådet fått i uppdrag av regeringen att under 2014 ta fram nationella riktlinjer för öppen tillgång till vetenskaplig information (open access).4 Femton svenska lärosäten har idag en policy som kräver eller rekommenderar OA-publicering.5 Det är alltså fortfarande många som saknar en sådan. Detta projekt är tänkt att ge en förutsättning för att fatta välgrundade strategiska beslut genom att ge en klar och tydlig bild av nuläget vad gäller svensk OA-publicering. 2.1 Bakgrund och syfte Syftet med det här projektet har varit att kartlägga situationen i Sverige vad gäller OA-publicering. Hur stor del av den svenska forskningen publiceras open access? Av avgränsningsskäl har vi valt att studera ett publiceringsår. För att täcka in den del av grön OA som omfattas av embargo, har vi valt året 2011. Vid tidpunkten för vår mätning (våren 2013) har de allra flesta eventuella embargolåsta artiklar för det året då öppnats. Vi har studerat den totala andelen open access-publikationer, både så kallad guld och grön open access, dels nationellt, och dels per lärosäte. Vi har också velat undersöka hur stor andel av artiklarna i vårt underlag som skulle kunna parallellpubliceras enligt SHERPA/RoMEO, men där så inte skett. Den kunskapen är intressant men också nödvändig för att man ska kunna välja strategi för vidare arbete mot open access. Ytterligare studier kan söka orsaken till varför artiklar ej parallellpublicerats fast möjlighet därtill funnits. Kan det bero på bristande information om villkoren, att det är krångligt att parallellpublicera eller helt enkelt en ovilja hos författare, eller något annat. Syftet med vår studie har också varit att ta fram metodik för att skapa förutsättningar för framtida mätningar av svensk OA-publicering. 2.2 Projektinformation Projektet pågick under perioden januari 2013 – januari 2014 och finansierades av programmet OpenAccess.se, Kungliga Biblioteket med 193 868 kr. 1 European Commission (2012). 2 Willetts, D. (2012). National Principles for Open Access Policy Statement Ireland (2012). 3 Memorandum for the heads of executive departments and agencies (2013). 4 Vetenskapsrådet: http://www.vr.se/franvetenskapsradet/nyhetsarkiv/nyheter2013/vetenskapsradetskataframnationellariktlinjerforopenac cess.5.7e727b6e141e9ed702b3398.html 5 Svensson (2011). 7 Deltagare i projektet har varit Tomas Lundén, projektledare, Göteborgs universitetsbibliotek, Peter Sjögårde, KTH:s bibliotek samt Margareta Fathli, KTH:s bibliotek. En första presentation av projektet gavs vid Mötesplats Open Access i Göteborg i april 2013. Det presenterades även med preliminära resultat vid Open Access Barometer - symposium vid Københavns Universitet den 31 maj 2013. Presentation av det slutliga resultatet ägde rum vid Mötesplats Open Access i Växjö 1-2 april 2014. 2.3 Begrepp och definitioner Innan vi redogör för den statistiska undersökningen, är det av vikt att beskriva och definiera de olika begrepp som används i rapporten. Begreppet open access myntades 2002 i the Budapest Open Access initiative (BOAI) och detta tillsammans med The Bethesda statement on Open Access Publishing (2003) och the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities (2003), har beskrivit vad open access innebär. Peter Suber sammanfattar definitionen såsom: Open access (OA) literature is digital, online, free of charge, and free of most copyright and licensing restrictions.6 Vi har försökt att genomgående använda svenska termer men eftersom termen open access är så vedertagen har vi valt att använda detta engelska begrepp i rapporten, vanligtvis förkortat till OA. Alternativet skulle vara att använda fri tillgänglighet eller öppen tillgång som är de termer som används i regeringens forskningsproposition 2012.7 Sedan BOAI 2002 har olika varianter av open access definierats. Redan från början angavs två ”vägar” till open access. Dessa vägar benämndes så småningom den gröna respektive den gyllene vägen. Men även begrepp som hybrid, fördröjd (delayed), gratis samt libre open access har uppstått. I det följande definierar vi hur vi använder begreppen i föreliggande rapport: Grön OA – innebär generellt att en kopia av en förlagspublicerad artikel har deponerats och tillgängliggjorts i något institutionellt arkiv eller något ämnesarkiv världen över. De versioner av en artikel som parallellpubliceras kan vara: inskickad version (submitted, benämns ofta preprint) – författarens manuskript som ännu ej är granskat av något förlag, accepterad version (accepted, benämns ofta postprint) – som har genomgått peer review och är accepterad för publicering fast viss redigering återstår, eller förlagsutgiven version (published) - den slutgiltigt publicerade artikeln. Det förekommer ofta att forskare lägger sina artiklar på egna personliga webbsidor, eller någonstans på sitt lärosätes webb. I en del undersökningar har även denna typ av parallellpublicering behandlats som grön OA.8 Vi menar dock att det är väsentligt att en parallellpublicerad kopia av en artikel bör finnas i ett beständigt arkiv och att det bör finnas vissa grundläggande krav för att en artikel ska få klassas som grön OA, och utgår från den ståndpunkten i vår undersökning och följer därmed Berlindeklarationens krav på OA: A complete version of the work and all supplemental materials, including a copy of the permission as stated above, in an appropriate standard electronic format is deposited (and thus published) in at least one online repository using suitable technical standards (such as the Open Archive definitions) that is supported and maintained by an academic institution, 6 Suber (2012), s.4. 7 Forskning och innovation, Prop. 2012/13:30. 8 Se t.ex. Gargouri et al (2012). 8 scholarly society, government agency, or other well-established organization that seeks to enable open access, unrestricted distribution, inter operability, and long-term archiving.9 Guld OA eller gyllene OA – innebär att artikeln blir fritt tillgänglig på tidskriftens webbplats omedelbart vid publicering. Tidskriften är OA som helhet, det vill säga alla artiklar är fritt tillgängliga direkt vid publicering. Ibland sker detta mot en avgift (s.k. Article Processing Charge = APC), ibland inte. Hybrid OA– innebär artiklar som är fritt tillgängliga omedelbart vid publicering, på ett i övrigt traditionellt förlags webbsida. I regel innebär det att författaren har betalt en avgift för publiceringen. Fördröjd OA – Traditionellt publicerade artiklar som det utgivande förlaget lägger fritt tillgängligt på sin egen webbsida efter en viss period. Tiden innan artikeln läggs fritt kan variera från ett par månader till ett par år och baseras i regel på när försäljningsintäkterna har passerat sin kulmen. Det diskuteras om detta är att betrakta som ”egentlig” open access. Vi har valt att redovisa denna kategori i undersökningen för att få en uppfattning av kategorins storlek och för jämförelse med andra studier.10 Figur 1: Venn-diagram över de olika kategorierna av open access och hur ett ungefärligt överlapp kan tänkas se ut. Venn-diagramet i Figur 1 ger en skiss av hur OA-landskapet kan tänkas se ut. Skissen är inte empiriskt baserad utan är endast tänkt som ett teoretiskt verktyg för att vi ska få en uppfattning av hur de olika kategorierna ungefärligen förhåller sig till varandra. Förutom de kategorier av OA som nämnts ovan så har även kategorin annan OA lagts till i diagramet. Denna kategori innefattar fritt tillgängliggörande via webbsidor, sociala medier eller andra platser på webben. Som vi ser innefattas stora delar av OA-publiceringen inom den grå cirkeln som representerar den traditionella prenumerationsbaserade publiceringen. Det kan diskuteras om dessa delar av OA-publiceringen förändrar publiceringsmodellerna i grunden eftersom de förutsätter att publicering först sker i traditionella kanaler. 9 http://openaccess.mpg.de/286432/Berlin-Declaration 10 Benämningen är tagen från Laakso & Björk (2013), ”delayed OA” på engelska. 9 3 Tidigare studier Andelen OA av den totala vetenskapliga artikelpubliceringen har på senare år mätts i flera olika studier. Här fokuseras främst på de som studerat den totala andelen OA, och inte enbart OA för ett specifikt ämnesområde. Även de än så länge få studier som behandlar Sverige och Norden tas upp. Det är framför allt två forskargrupper som studerat tillväxt av och andel OA. En grupp ledd av professor Bo-Christer Björk vid Hanken (Svenska Handelshögskolan) i Helsingfors, samt en grupp under ledning av professor Stevan Harnad vid Université du Quebec à Montréal. Björk med kollegor har arbetat med manuella sökningar av urval av artiklar, medan Harnad-gruppens metod innefattar automatiserad web crawling med en sökrobot. Utöver studier av dessa grupper finns även en del andra oberoende studier. Det faktum att alla studier använder sig av varierande metoder, delvis olika artikelindex och olika principer för urval gör att studierna blir svåra att jämföra. Dessutom kan tiden mellan publiceringsår för studerade artiklar och året då mätningen gjordes vara en faktor i divergerande resultat, speciellt för grön OA. Om OA-publiceringen mäts kort efter publiceringstillfället kan embargo fortfarande gälla. En tidig studie baserad på tidskrifter och artiklar i Thomson Reuters Web of Knowledge (WoK) 2003 fann att 2,9 procent av artiklarna var publicerade i direkta OA-tidskrifter det året.11 Tre studier av Harnads team, med automatiserad robotcrawling, har visat på en uppgång i den totala OA-tillgången från 10 procent (publiceringsår 2003),12 till 21 procent (2006) och 23,1 procent (2010).13 Ett problem med dessa studier är att där inte har specificerats vilken typ av OA som mäts utöver en distinktion mellan guld och grön OA. Grön OA har i dessa studier såvitt vi kan bedöma, definierats som fritt tillgängliga artiklar som hittats av sökroboten var som helst på webben (utom i tidskrifter indexerade i Directory of Open Access Journals14). Björks grupp har använt manuella sökningar utifrån mindre urval. Deras metod har möjliggjort en bättre klassificering av OA-typer. Deras resultat visar på en uppgång i OA-andel som på det stora hela ligger i linje med och kompletterar Harnad-gruppens. Resultat för total OA-andel för publiceringsår 2006 befinns vara 19,4 procent och för år 2008 20,4 procent.15 Vad gäller guld OA finner Laakso & Björk en uppgång från 8,1 procent 2008 till 11 procent 2011 (baserat på Scopus-artiklar).16 De har också genomfört en studie över så kallad fördröjd OA17 och Björk har även studerat hybrid OA. Björk och en tidigare studie har visat att andelen hybrid OA än så länge är mycket liten, runt 2 procent av totala antalet artiklar i hybridtidskrifter, och att det inte finns någon strukturerad och lättillgänglig data om fenomenet.18 Det skulle vara önskvärt att bättre källor blir tillgängliga, så att andelen hybrid OA går att följa över tid. Björks & Laaksos senaste beräkning på andel global grön OA (definierad som fria artiklar som inte finns i DOAJ-tidskrifter eller som fördröjd eller hybrid OA) ligger på ca 12 procent.19 En utvärderande studie över Storbritanniens forskning utförd av Elsevier, och beställd av Storbritanniens Department for Business, Innovation and Skills (BIS) som kom 2013 visar ett resultat för global guld OA för år 2012 på 9,7 procent (också detta baserat på artiklar i Scopus). Det är lite förvånande eftersom det skulle 11 McVeigh (2004). 12 Hajjem et al (2005). 13 Gargouri et al (2012). 14 Directory of Open Access Journals (DOAJ) är en databas över OA-tidskrifter. http://doaj.org/. 15 Björk et al (2009). Björk et al (2010). 16 Laakso & Björk (2012). 17 Laakso & Björk (2013). Se även Laakso & Björk (2012) som visar att ca 5% av alla artiklar i Scopus publicerade 2011 utgjordes av fördröjd OA. 18 Björk (2012). Dallmeier-Thiessen et al (2010). Elsevier (2013) finner endast en global andel hybrid på 0,5 %. 19 Björk et al (2014). 10 innebära en minskning med någon procentenhet från föregående år, jämfört med Laaksos & Björks studie (2012).20 Under 2013 kom även en annan studie som väckte visst uppseende. Företaget Science-Metrix utförde en studie på beställning av Europeiska kommissionen. Studien undersöker artiklar publicerade 2004-2011 och använder i likhet med Harnad-gruppen en automatiserad sökrobotmetod. Det övergripande resultatet visar på en global OA-andel på 44 procent för publiceringsår 2011, fördelat på 11,5 procent guld OA och 32,5 procent grön och hybrid OA. I grön och hybrid OA inbegrips alla fria artiklar vid mättillfället. Studien beräknar därutöver en justerad OA-tillgänglighetskurva (baserad på en urvalsundersökning på 500 artiklar), där tillgängligheten i verkligheten skulle hamna på över 50 procent globalt. Det skulle innebära att OA har nått en "tipping point” under 2011, som det uttrycks i rapporten.21 Varför resultaten hos Archambault et al skiljer sig så mycket från tidigare studier ger de själva några möjliga förklaringar till:  till skillnad från Harnads team använder de Scopus i stället för WoK som artikelindex för urvalet, vilket skulle kunna förklara att fler artiklar hittas. Scopus har en bredare täckning än WoK.  Science-Metrix-teamets sökrobot är effektivare än Harnad-teamets, som de menar har en uppenbart bristfällig ”recall” vid sökningar.  ang skillnaden gentemot Björk-gruppens resultat, så utfördes sökningarna av Archambault et al senare (för publiceringsår 2008, vilket är det som jämförs), vilket innebär att fler artiklar blivit OA efter embargo. Vidare så pekar Science-Metrix på att Björk-teamets manuella sökningar i Google och Google Scholar inte hittar alla artiklar eftersom man i metoden endast tittar på de första tio sökträffarna. Dessutom sorterade Björk et al bort artiklar som kunde antas var fria av misstag på till exempel förlagssidor, något Science-Metrix inte gjort. Huruvida dessa förklaringar räcker för att förklara skillnaderna är svårt att avgöra. Liksom med Harnad- gruppens studier är den stora bristen att man inte differentierar mellan olika typer av grön och annan OA, samt att någon egentlig verifiering av de fulltextfiler sökroboten hittar inte gjorts. Vad gäller studier kring OA-andel som specifikt rör Norden och Sverige, så är de färre i antal. Som en delmängd av studien utförd av Björk et al (2010) kring den globala OA-andelen för publiceringsår 2008, utfördes också en nordisk studie, inom ramen för programmet Nordbib.22 Den nordiska studien visade på en total OA-andel för de nordiska länderna på 22,2 procent. Studerade artiklar var indexerade i Scopus, med minst en av författarna affilierad till ett nordiskt lärosäte. För Sverige var siffran 22,6 procent, alltså strax över det nordiska genomsnittet. Det fördelade sig ganska jämnt över guld och grön OA, 11,4 procent respektive 11,2 procent. Skillnader mellan de nordiska länderna var framför allt att Norge hade mer guld OA än grön (11,6 procent guld och 6,9 procent grön), medan i Danmark var situationen tvärtom, med en hög andel grön OA (6,2 procent guld och 19,1 procent grön). Island har en liknande fördelning som Danmark.23 Archambault et al (2013) genomför i sin studie också en undersökning över läget i EU-länderna och EFTA (European Free Trade Association), ERA (European Research Area), samt USA, Kanada, Brasilien och Japan. De räknar fraktionerat utifrån vilket land författarna tillhör, med Scopus-artiklar från åren 2008-2011. 20 Elsevier (2013). 21 Archambault et al (2013). 22 Nordbib: OA-barometer 2009. http://www.nordbib.net/Projects/OA-barometer-2009.aspx. 23 Hedlund (2010). 11 Sverige får då resultatet 48 procent OA, fördelat på 8 procent guld, 40 procent grön/hybrid. Danmark ligger högst av de nordiska länderna med 53 procent total OA, med en dominans av grön OA på 45 procent. Noteras bör återigen studiens mycket inkluderande definition av grön och hybrid OA. EU som helhet hamnar på 45 procent totalt (37 procent grön, 8 procent guld), alla undersökta länder tillsammans på 43 procent totalt (33 procent grön, 10 procent guld). Parallellt med vår studie har ett liknande projekt pågått i Danmark, benämnt Dansk OA Barometer.24 Projektet har pågått under samma tidsperiod, 2013, och har varit finansierat av DEFF (Danmarks Elektroniske Fag- og Forskningsbibliotek). Syftet med det danska projektet var dels att undersöka hur mycket av dansk forskning 2011 som är open access, samt att utveckla en webbaserad ”barometer” som kontinuerligt kan användas för att avläsa OA-status i Danmark. Grunddatat för den danska studien har tagits från den nationella databasen Den bibliometriske forskningsindikator (BFI) och Den Danske Forskningsdatabase (för länkar till fulltexter). Vid undersökning av guld OA (via DOAJ) och grön OA i de egna institutionella arkiven vid de danska universiteten hamnade resultatet för refereegranskade artiklar på 11 procent OA. En manuell review gjordes sedan vid respektive universitet, där artiklarna eftersöktes i Google Scholar, för att hitta kopior i ämnesarkiv eller andra arkiv, i enlighet med projektets definition av OA.25 Slutsiffran blev då 21 procent OA för 2011.26 Sammantaget kan man säga angående de olika studier som hittills gjorts, att Science-Metrix-studiens avvikande resultat pekar på behovet av ytterligare forskning för att kunna verifiera resultaten, samt också för att vidare diskutera hur OA bör och kan mätas. Det kan finnas anledning att sträva mot mer standardiserade definitioner av vad som ska mätas och mer förfinade verktyg för att genomföra mätningarna. I Tabell 1 har vi sammanställts en översikt över de senaste årens viktigaste studier. Den är baserad på en tabell i Björk et al (2014), men modifierad för att inkorporera även Elsevier-studien och Archambault et al. De sista enskilda åren valdes från Gargouri et al (2012). Samma tabell, men även inkluderande resultaten från föreliggande studie, finns i Appendix, Tabell 18. Eftersom vi i denna studie också undersöker den möjliga parallellpubliceringen, det vill säga hur stor del av svenskförfattade artiklar från 2011 som skulle kunna parallellpubliceras, är det värt att notera att det nyligen har gjorts en del kvantitativa studier kring potentiell parallellpublicering. En studie av Hansen (2012) har undersökt artiklar ur WoK med publiceringsår 2011 och med författare från fem större amerikanska forskningsuniversitet. Efter att ha sållat bort dubbletter beroende på samförfattande hamnade artikelmängden på 29 322. Via ISSN matchades artiklarna mot SHERPA/ROMEOs databas. Resultatet visade att cirka 71 procent av artiklarna skulle kunna parallellpubliceras direkt utan embargo (ca 15 procent förlags-pdf, 56 procent accepterat författarmanuskript, s.k. postprint). Med någon form av embargo, från 6 till 24 månader, hamnade siffran på hela 95 procent (ca 20 procent förlags-pdf, 75 procent accepterat författarmanuskript). I studien har OA-förlag inte sorterats bort.27 24 http://projekter.bibliotekogmedier.dk/projekt/dansk-open-access-barometer. Dansk OA Barometer wiki: https://infoshare.dtv.dk/twiki/bin/view/OpenAccessBarometer 25 Dansk OA Barometers definition av OA: https://infoshare.dtv.dk/twiki/bin/view/OpenAccessBarometer/ProjektDelEt#Definition_af_Open_Access 26 Elbæk et al (2014). BFI: http://fivu.dk/forskning-og-innovation/statistik-og-analyser/den-bibliometriske- forskningsindikator. Den Danske Forskningsdatabase: http://www.forskningsdatabasen.dk/. 27 Hansen (2012). Tabell 1: Översikt över senare års studier över andel OA. Siffrorna är procenttal av alla artiklar som ingår i det studerade indexet. Modifierad efter Björk et al (2014). Studie Publiceringsår för studerade artiklar År när mätningen gjordes Index/källa för artiklar Artiklar i OA- tidskrifter Artiklar med fördröjd OA Hybrid OA- artiklar Övriga fritt tillgängliga artiklar Grön OA- artiklar i ämnesarkiv Grön OA- artiklar i institutionella arkiv Total OA globalt Björk et al 2009 2006 2007 Ulrich´s 4,6 3,5 3,0 3,3 5,0 19,4 Gargouri et al 2012 2006 2009 WoK 21,0 21,0 Björk et al 2010 2008 2009 Scopus 5,3 1,2 2,0 11,9 20,4 Gargouri et al 2012 2010 2011 WoK 1,2 21,9 23,1 Laakso & Björk 2012 2011 2012 Scopus 11,0 5,2 0,7 Archambault et al 2013 2011 2013 Scopus 11,5 32,5 44,0 Elsevier 2013 2012 (guld), 2011-2013 (grön, hybrid, fördröjd) 2013 Scopus 9,7 1,0 0,5 11,4 Studie (svensk OA) Publiceringsår för studerade artiklar År när mätningen gjordes Index/källa för artiklar Artiklar i OA- tidskrifter Artiklar med fördröjd OA Hybrid OA- artiklar Övriga fritt tillgängliga artiklar Grön OA- artiklar i ämnesarkiv Grön OA- artiklar i institutionella sarkiv Total OA Sverige Hedlund 2010 2008 2009 Scopus 11,4 11,2 22,6 Archambault et al 2013 2008-2011 2013 Scopus 8,0 40,0 48,0 13 Laakso (2013) studerar artiklar indexerade i Scopus och publicerade 2010. Han identifierar i sin studie de 100 största förlagen baserat på artikelvolym, och använder det som grunddata. Tio större OA-förlag bland de 100 sorterades bort. Laakso fann att det var svårt att få fram strukturerad information ur SHERPA/RoMEO- databasen kring till exempel embargotider, var parallellpublicering får ske, samt ibland vad gäller vilken version som får läggas ut. Han kompletterade data med att manuellt undersöka förlagens hemsidor. Laaksos resultat ligger ganska nära Hansens. Ungefär 74 procent av artiklarna får parallellpubliceras direkt utan embargo (9 procent förlags-pdf, 65 procent accepterat författarmanuskript). Inklusive embargotider blir siffran närmare 93 procent (ca 12 procent förlags-pdf, 81 procent accepterat författarmanuskript).28 Onekligen förefaller det finnas utrymme för en ökad OA-tillgång genom parallellpublicering, vilket båda dessa studier visar. 4 Data och metod 4.1 Datakällor Den svenska nationella publikationsdatabasen Swepub har använts som primärkälla för föreliggande undersökning.29 Data från Swepub finns fritt tillgängligt som XML-format.30 För undersökningen har en kopia av den databas med dubblettdeduplicerad Swepub-data som Vetenskapsrådet byggt upp använts. Datauttaget från Swepub gjordes 13 maj 2013. Alternativa datakällor som övervägdes för analysen var Web of Science och Scopus. Dessa databaser täcker framförallt artiklar som publicerats på engelska och har således sämre täckning av artiklar som publicerats på andra språk, däribland svenska. Det är också känt att Web of Science och Scopus har en bättre täckning inom medicin och naturvetenskap än inom samhällsvetenskap och humaniora. Genom att använda Swepub har fler artiklar kunnat räknas med i undersökningen än om någon annan datakälla hade utgjort primärkälla för undersökningen. I dagsläget går det att ifrågasätta Swepubs datakvalitet. Bedömningen har dock gjorts att kvaliteten är tillräcklig för att få en uppfattning om svensk OA-publicering på aggregerad nivå. Resultat på lärosätesnivå är dock känsligare för kvalitetsbrister som kan förekomma i data från enskilda lärosäten. Swepub innehåller även länkar till parallellpublicerade artiklar i de lokala publikationsdatabaser som levererar data till Swepub vilket gör Swepub till en lämplig källa för att studera grön OA-publicering i Sverige. Information om vilken version som parallellpublicerats finns dock inte i Swepub. Det kan antas att den vanligaste policyn vid svenska lärosäten är att parallellpublicera den accepterade versionen eller förlagsversionen men andra versioner kan alltså förekomma i dataunderlaget. En anledning att använda Swepub-data är också att undersökningen även syftar till att skapa metoder för att mäta OA-publicering i framtiden. Kungliga biblioteket har fått i uppdrag av regeringen att tillsammans med Vetenskapsrådet och lärosätena (via SUHF) ”vidareutveckla databasen SwePub för att möjliggöra och kvalitetssäkra bibliometriska analyser”.31 Projektet som pågår just nu och ska avslutas under 2015, ska förbättra datakvaliteten i Swepub, särskilt just för att kunna användas för statistik av publicering. Denna undersökning är därför även del av den utvecklingen där vi genom att använda Swepub kan bidra till insikter om dels hur kvaliteten i Swepub ser ut i dagsläget, och dels vilken kvalitet som studier liknande denna ställer på bibliografiska data. 28 Laakso (2013). 29 http://www.swepub.se/ 30 http://www.kb.se/libris/teknisk-information/SwePub/ 31 Forsknings- och innovationsproposition, Prop. 2012/13:30. Se även: http://librisbloggen.kb.se/tag/swepub/ 14 Directory of Open Access Journals (DOAJ) har använts för beräkning av guld open access. DOAJ innehöll vid analystillfället ca 9 200 tidskrifter från alla ämnesdiscipliner. Ett kriterium för att registreras i DOAJ är att tidskrifterna ger fri tillgång till allt material i tidskriften utan någon embargoperiod. Ett krav är även att tidskriften har ett ISSN. DOAJ innehåller förvisso inte alla världens open access-tidskrifter, dessutom ligger ett okänt antal tidskrifter i kö för att upptas i databasen, men det är en etablerad källa för OA-tidskrifter.32 DOAJ har också använts i en rad andra undersökningar vilket gör resultaten jämförbara med dessa. Andelen fördröjd open access har uppmätts genom att använda en lista på tidskrifter som har tagits fram av Laakso och Björk.33 Det finns i dagsläget inget register över tidskrifter som tillämpar fördröjd OA. Laakso och Björk har sammanställt information från flera olika källor. De har använt data från HighWire Press, PMC, Elsevier, en Wikipedia-sida över tidskrifter som tillämpar fördröjd OA och tidskrifter som de identifierat i tidigare studier. Laakso och Björks studie resulterade i 492 tidskrifter med fördröjd OA från 2011 vilka sammantaget innehöll 111 312 artiklar. Listan är därmed den mest omfattande tillgängliga källan för fördröjd OA-publicering. För att ta fram statistik om de villkor som förlagen ställer angående parallellpublicering användes SHERPA/RoMEO.34 SHERPA/RoMEO innehåller förlagsvillkor för över 22 000 tidskrifter.35 Förlagens villkor varierar mycket sinsemellan och ibland också mellan tidskrifter som ges ut av ett och samma förlag. Det är problematiskt att dela in förlagsvillkoren i tydligt avskilda kategorier på grund av den stora variationen. Indelningen av villkorsuppgifter i SHERPA/RoMEO är därför av relativt grov natur, vilken i viss mån gör våld på verkligheten. Kategoriseringen ger dock en uppfattning av i vilken utsträckning som artiklarna i undersökningen kan parallellpublicerats och informationen från SHERPA/RoMEO har därför använts för detta ändamål. Svårigheten med att få ut strukturerad och exakt information ur SHERPA/RoMEO har som sagt noterats av Laakso (2013), samt också i samband med två tidigare KB-finansierade projekt. I ett projekt togs programvaran Journal Information Resource (JIR) fram baserad på data i SHERPA/RoMEO. JIR testades sedan i ett uppföljande projekt i publiceringsssystemet DiVA som en möjlig automatisk uppslagstjänst. Det bedömdes att JIR gav alltför osäkra uppgifter om publiceringsvillkor för att kunna tillhandahålla tillförlitlig information.36 Publiceringsmönster och förutsättningar för den vetenskapliga publiceringen skiljer sig mellan olika forskningsfält. Det har därför varit av intresse att ta fram separat statistik för OA-publicering inom olika forskningsfält, även om det inte varit projektets huvudsyfte. Det saknas dock gemensamma riktlinjer för hur ämneskategorisering ska registreras i poster som går över till Swepub.37 Ämnestilldelning, utifrån den standard som finns för svensk indelning av forskningsämnen, görs dessutom på olika hierarkiska nivåer när publikationer registreras i de lokala databaserna. Dock använder inte alla samma standard. Poster från Karolinska institutet (KI) och Sveriges lantbruksuniversitet (SLU) saknar exempelvis sådan ämnesindelning. I stället har vi därför använt den ontologi över ämneskategorier som tagits fram av Science Metrix och som översatts av Ulf Sandström och Ulf Heyman.38 Ontologin omfattar tidskrifter som finns indexerade i Web of 32 Laakso & Björk (2012). 33 Laakso & Björk (2013). Projektgruppen vill tacka Mikael Laakso och Bo-Christer Björk för att de delade med sig av data rörande fördröjd OA. 34 http://www.sherpa.ac.uk 35 http://www.sherpa.ac.uk/romeo/faq.php 36 Sandewall (2012). Svensson (2012). 37 Norman & Scheutz (2013). 38 Archambault & Beauchesne (2011a). 15 Science och Scopus, samt innehåller minst 30 publikationer, 30 referenser, och som fått 30 citeringar.39 Indelningen är gjord på basis av citeringsströmmar och delar in tidskrifterna i domäner, fält och delfält. Endast domäner och fält har använts i denna undersökning eftersom antalet publikationer blir mycket lågt i många delfält. Som nämnts så saknas lättillgängliga källor för att mäta open access-publicering av enskilda artiklar i avgiftsbelagda tidskrifter, så kallad hybrid OA. Detta har därför inte gjorts vid undersökningen av det totala antalet publikationer. Däremot har hybrid OA-publicering och annan OA analyserats i ett urval om 1000 manuellt kontrollerade poster (Se 4.4 Manuell sökning av slumpvis urval av 1000 poster). 4.2 Undantag av dataunderlag och manuella tillägg Karolinska institutet (KI) och Sveriges lantbruksuniversitet (SLU) levererar i dagsläget inte data till Swepub. Vi försågs därför med data direkt från dessa lärosäten. Dessa data är i undersökningen begränsade till publikationer som finns indexerade i Web of Science. Både KI och SLU bedriver forskning inom områden vars publikationer har hög representation i Web of Science, varför denna begränsning bör ha liten påverkan på resultatet på aggregerad nivå. För att undvika dubbelräkning av sampublicerade artiklar matchades data från KI med data från SLU och sedan med data från Swepub. Matchning gjordes på den identifierare som finns i Web of Science och på DOI-nummer. Förutom undantagen vad gäller KI:s poster och SLU:s poster förekommer även några andra undantag då brister i Swepub-data har upptäckts. Dessa brister beror framförallt på att vissa problem med leverenser till Swepub har funnits på några lärosäten. Luleå tekniska universitet (LTU) levererade vid tillfället för datauttaget inga artiklar som var markerade som refereegranskade. Länkar saknades även till parallellpublicerade poster i LTU:s publikationsdatabas. Posterna i Swepub kompletterades därför med information om refereegranskning och parallellpublicering med hjälp av data från LTU:s publikationsdatabas. Vid datauttag från Swepub hittades inga fulltextlänkar från Högskolan i Borås. I Borås publikationsdatabas fanns dock parallellpublicerade poster vilket vi fick kännedom om då preliminärt resultat skickades ut till lärosätena för verifiering. Sökning gjordes därför manuellt i högskolans publikationsdatabas och i Swepub som vid detta senare tillfälle (5 juni 2013) innehöll länkar till parallellpublicerade publikationer. Nio poster markerades därför manuellt som parallellpublicerade. På grund av ett lokalt importfel i Karlstad universitets DiVA har 48 poster därifrån inte räknats med i undersökningen eftersom dessa inte hade höstats till Swepub. Göteborgs universitet bytte system för hantering av parallellpublicering under året 2011. Det innebär att antalet parallellpublicerade poster i beräkningen blev lägre än det reella antalet. Därför kompletterades data med uppgifter om parallellpublicering från det system som tidigare användes vid Göteborgs universitet. 4.3 Analys av Swepub-data Data bearbetades i statistikprogrammet SAS Enterprise Guide och i Microsoft Excel. Artiklar och forskningsöversikter inkluderades i analysen och begränsning gjordes till refereegranskade publikationer. Organisationskoppling förekommer i två skilda fält i Swepub-data. Båda dessa användes i analysen så att 39 Archambault et al (2011b). 16 poster räknades då förekomst av ett lärosätes namn fanns i något av fälten. Förekomster av olika namnformer homogeniserades. För statistik på lärosätesnivå räknades poster från KI och SLU endast till dessa lärosäten oavsett om poster från Web of Science som inte matchades till Swepub-posterna även innehöll adresser till andra lärosäten. Detta val gjordes för att minska felkällor och för att behandla poster från KI och SLU likvärdigt med poster från övriga lärosäten där adresser till samtliga författare inte konsekvent registreras i posterna. Samtlig statistik räknades ofraktionaliserat. Utifrån Swepub-data är fraktionalisering inte möjlig eftersom samtliga författare inte är registrerade i alla poster och i nuläget är inte heller antalet författare registrerat i databasen (fraktionalisering kommer dock troligen att vara möjlig i framtiden). Hel räkning av publikationer är intuitivt lättare att förstå och relatera till eftersom volymerna då explicit avspeglar antalet artiklar. Hel räkning ansågs också vara lämplig för ändamålet och har i huvudsak även tillämpats av tidigare studier för mätning av open access-publicering.40 Eftersom datauttag gjordes i maj 2013 så har artiklar som publicerats 2011 kunnat parallellpubliceras i mellan 29 månader och 17 månader. Uttaget av artiklar med fördröjd OA gjordes i juni 2013. Artiklar med max 18 månaders embargo togs med för att de vid mitten av 2013 skulle vara fritt tillgängliga, vilket ger samma förutsättningar i studien för parallellpublicerade artiklar och artiklar publicerade med fördröjd OA. På lärosätesnivå räknades grön OA-publicering endast om fulltextlänk i Swepub kom från lärosätets egna arkiv. För de lärosäten där undantag för data har gjorts har samma princip tillämpats. Det som mätts är således respektive lärosätes parallellpublicering och inte det totala antalet av lärosätets poster som har parallellpublicerats någonstans, exempelvis vid ett annat lärosäte eller i ämnesarkiv. Det totala antalet publikationer som finns tillgängligt som grön OA är därmed större än vad som redovisas på lärosätesnivå i denna studie. Vi tror dock att det kan vara av intresse att se hur stor parallellpubliceringen är för varje lärosäte, bland annat för utvärdering och planering av det lokala OA-arbetet. Statistik på lärosätesnivå redovisas i appendix 8.1 Resultat uppdelat per lärosäte. För resultat på aggregerad nivå gäller att parallellpublicering ska ha skett på något av de lärosäten som inkluderats i studien för att en post skall räknas som grön OA. Fält för identifierare och ISSN städades i Swepub-data för att kunna matchas med andra data. Detta innebar bland annat att prefix till DOI-nummer togs bort och att skiljetecken i ISSN togs bort. Efter denna korrigering av nämnda fält gjordes matchning mellan de olika källor som beskrivits ovan. Matchning mot Science-Metrix, DOAJ och listan med fördröjd open access gjordes endast med ISSN. Ca 96 procent av posterna i studien hade ett ISSN. För att verifiera resultaten skickades dessa i juni 2013 ut till personer som arbetar med de lokala publikationsdatabaserna vid samtliga lärosäten som ingick i studien. Några justeringar gjordes efter detta utskick utifrån de kommentarer som då kom in (Se Undantag av dataunderlag och manuella tillägg). Det preliminära resultatet skiljer sig också från det slutgiltiga på det sätt att poster från KI och SLU även räknades till andra lärosäten som förekom i adresserna. Valet att inte räkna med dessa poster för andra lärosäten än KI och SLU har motiverats ovan. 40 Se exempelvis Björk et al. (2010), Hedlund (2010). 17 4.4 Manuell sökning av slumpvis urval av 1000 poster Eftersom OA-publicering sker på flera olika sätt, finns det begränsningar i hur man på automatiserad väg kan mäta detta fenomen. Ett urval om 1000 slumpvis utvalda poster från den undersökta publikationsmängden gjordes för manuell genomgång, för att få en uppfattning av hur stor andel artiklar som OA-publiceras utöver den publicering som sker i OA-tidskrifter och/eller i svenska institutionella arkiv. Det handlar exempelvis om OA-publicering av enskilda artiklar i så kallade hybridtidskrifter, publicering i öppna ämnesarkiv (exempelvis arXiv), parallellpublicering i institutionella arkiv utanför Sverige och tillgängliggörande via sociala medier eller på andra webbplatser. Av de 1 000 posterna som inte var publicerade i OA-tidskrifter, tidskrifter med fördröjd OA eller var parallellpublicerade i svenska arkiv, söktes återstoden upp manuellt i Google och i Google Scholar. Totalt blev det 741 poster. Detta gjordes utanför lärosätenas nät för att tillgång till tidskrifterna inte skulle finnas via proxy-server. Sökningarna, som utfördes i oktober-november 2013, gjordes på titel och endast resultat på första träffsidan i respektive sökmotor kontrollerades, dvs. de tio första träffarna. Denna metod är inte fri från brister eftersom Google inte indexerar allt som finns tillgängligt på internet och alla relevanta träffar dyker inte upp på första resultatsidan. Dock ger denna komplettering en bredare insyn i OA-publiceringens olika former och visar den tillgänglighet som finns på internet av svenska vetenskapliga artiklar. Den deduplicering som finns i Google Scholar förbättrar dessutom möjligheterna att dels få uttömmande sökresultat och dels att se olika källor där en artikel finns tillgänglig. Google har också använts i andra studier.41 De publikationer där fulltext gick att identifiera markerades i uttaget med ”annan OA”. Markering angavs även för typ av källa. Eftersom sökning endast gjordes på de publikationer som inte redan hade konstaterats vara open access så har inte överlappet mellan ”annan OA” och grön respektive guld OA inkluderats i studien. Överlapp förekommer dock inom kategorin ”annan OA” vilket redovisas i kapitel 5.2 Resultat för slumpvis urval om 1 000 artiklar, tabell 5. Vad gäller artikelversioner, så undersöktes detta inte närmare. Om en fulltext hittades, så medräknades den. Endast om det uttryckligen stod att en artikel var en ”preprint”, så medräknades den inte, i andra fall förutsattes att artikeln var en accepterad version (”postprint”). Även förlagsversioner medräknades, eftersom det inte var möjligt inom tidsramen att kontrollera om artikeln var uppladdad i enlighet med tidskriftens policy eller inte. 5 Resultat 5.1 Resultat för samtliga lärosäten sammantaget Sammanställningen av resultaten visar en mångfacetterad bild av OA-publicering för artiklar med affiliering till svenska lärosäten. Hur stor andel av artiklarna i undersökningen som finns fritt tillgänglig beror därför på vilken typ av publicering som ska betraktas som ”open access”. I Tabell 2 redovisas resultaten för guld, grön och fördröjd OA-publicering. Tabell 3 visar resultaten för kategorierna guld och grön OA, respektive guld, grön och fördröjd OA sammanräknade (överlapp borträknat). För samtliga lärosäten sammanräknade var drygt 10 procent av artiklarna från 2011 publicerade i OA-tidskrifter (Tabell 2). Då parallellpublicerade artiklar inkluderas i 41 Exempelvis Björk et al. (2010), Archambault et al. (2013). 18 statistiken uppgår andelen till 17 procent (Tabell 3), dvs. 17 procent av artiklarna är antingen publicerade i en OA-tidskrift eller parallellpublicerad i något av de svenska institutionella arkiv som ingår i undersökningen. Tre procent av artiklarna är både publicerade i en OA-tidskrift och parallellpublicerade. Tabell 2: Antal och andel av samtliga artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd OA. Tabellen visar även överlappet mellan de olika kategorierna. OA-kategori Antal Andel Guld 2495 10,4% Grön 2289 9,6% Fördröjd 2088 8,7% Överlapp - guld/grön -715 -3,0% Överlapp- grön/fördröjd -96 -0,4% Ej OA 17844 74,6% Totalt 23905 100,0% Räknar man även med den del av publiceringen som efter embargo publicerats på förlagens webbplatser, det som vi här har kallat fördröjd OA, uppgår siffran till drygt 25 procent (Tabell 3/Figur 2). I denna statistik har som nämnts endast tidskrifter med upp till 18 månaders embargo räknats med, vilket innebär att publikationer publicerade i slutet av 2011 senast ska funnits tillgängliga i mitten av 2013. Överlappet mellan fördröjd OA och grön OA är mycket litet (0,4 procent). Cirka en fjärdedel av artiklarna som publicerades av svenska lärosäten under 2011 fanns således fritt tillgängliga under 2013, antingen direkt på förlagens webbplatser (med eller utan fördröjning) eller i svenska institutionella arkiv. I Appendix 8.1, tabell 11-13 finns som nämnts resultat redovisat per lärosäte. Vi har valt att inte närmare analysera resultatet på lärosätesnivå. Nämnas kan dock att Linköpings universitet ligger högst med 37,4 procent totalt, räknat på guld eller grön OA. Andra lärosäten som ligger över 30 procent totalt är till exempel Blekinge tekniska högskola och Chalmers. Alla nämnda har en klar dominans av grön OA. Man kan spekulera om det i fallen BTH och Chalmers spelar in att de redan före 2011 hade OA-policies som ställer krav på att artiklar ska deponeras i det egna öppna arkivet.42 Tabell 3: Antal och andel av samtliga artiklar från 2011 som finns tillgängliga open access, överlapp borträknat. OA-kategori N Antal Andel Guld eller grön 23905 4069 17,0% Guld, grön eller fördröjd 23905 6061 25,4% 42 Svensson (2011). 19 Figur 2: Andel av samtliga artiklar från 2011 som finns tillgängliga open access. 5.2 Resultat för slumpvis urval om 1000 artiklar Som nämnts i metodavsnittet så gjordes ett slumpvis urval om 1000 artiklar för att komplettera den bild av OA-publiceringen som vi i denna undersökning har kunnat studera maskinellt. Denna OA-kategori som vi har valt att kalla ”annan OA” är inte homogen och omfattar såväl publicering i utländska institutionella eller ämnesarkiv, som publicering på förlagens webbplatser (utöver de som ingår i kategorierna guld OA och fördröjd OA). Det finns således anledning att betrakta resultaten för denna kategori med försiktighet. Av de publikationer som inte ingår i kategorierna grön eller guld OA så kunde 27,5 procent återfinnas fritt tillgängliga genom sökning i Google eller Google Scholar (Tabell 4). Då samtliga kategorier medräknas är andelen artiklar i detta urval, som på något sätt fanns fritt tillgängliga, 52,2 procent (Tabell 4), vilket innebär att vi med 95 procents säkerhet kan säga att andelen för hela den undersökta publikationsmängden ligger mellan 49,1 och 55,3 procent. Cirka hälften av artiklarna från 2011 fanns således tillgängliga under år 2013 via förlagens webbplatser, institutionella arkiv i Sverige eller kunde nås som fulltexter på andra webbplatser via Google eller Google Scholar. Tabell 4: Antal och andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access. OA-kategori N Antal Andel Guld eller grön 1000 183 18,3% Guld, grön eller fördröjd 1000 275 27,5% Guld, grön, fördröjd eller annan 1000 522 52,2% Guld Guld och grön Grön Grön och fördröjd Fördröjd Ej OA 20 Tabell 5: Antal och andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access, uppdelat på guld, grön, fördröjd och annan open access. OA-kategori Antal Andel Guld 110 11,0% Grön 98 9,8% Fördröjd 97 9,7% Annan OA 247 24,7% Överlapp - guld/grön -25 -2,5% Överlapp- grön/fördröjd -5 -0,5% Ej OA 478 47,8% Totalt 1000 100,0% Om vi tittar närmare på var publikationerna inom kategorin annan OA fanns tillgängliga (Tabell 6), ser vi att många återfanns i ämnesarkiv, institutionella arkiv eller på förlagens webbplats, men att den största kategorin återfanns på andra webbplatser såsom webbsidor för institutioner, forskares privata webbsidor eller i sociala medier, däribland ResearchGate.43 De artiklar som återfunnits på förlagets webbplats består till största delen av hybrid OA, men även av fördröjd OA (utanför de data som vi haft tillgång till) och ”tillfällig OA”, dvs. en artikel som under en viss period ligger fritt tillgänglig på ett förlags webbsida i marknadsföringssyfte eller liknande (eng. ”free sample article”). Resultaten för de manuella sökningarna visar tydligt att artiklar finns fritt tillgängliga på många olika sätt. Sammantaget var det en stor andel av de svenska forskningsartiklarna från 2011 som fanns tillgänglig på webben ett till två år efter publicering. Om samtliga dessa sätt att tillgängliggöra forskning ska betraktas som ”open access-publicering” beror på vilka kriterier man anser ska vara uppfyllda för att en artikel ska betraktas som OA-publicerad. Vi återkommer till denna fråga i diskussionsavsnittet. Figur 3: Andel av urval om 1000 artiklar från 2011 som finns tillgängliga open access. 43 ResearchGate är ett socialt nätverk för forskare med stöd för uppladdning av vetenskapliga publikationer. http://www.researchgate.net/. Guld Guld och grön Grön Grön och fördröjd Fördröjd Annan OA Ej OA 21 Tabell 6: Kategorin ”annan OA” i urvalet om 1000 artiklar från 2011, uppdelad efter plats för open access-publicering. OA-kategori Antal Ämnesarkiv 68 Institutionellt arkiv utanför Sverige 53 Förlagets webbplats 84 Annan webbplats 143 Överlapp -101 Totalt 247 5.3 OA-tidskrifter Databasen DOAJ innehåller per 2014-02-04 fler än 9 800 tidskrifter. För att en tidskrift ska bli registrerad i DOAJ krävs, utöver att allt material i tidskriften ska vara fritt tillgängligt utan embargo, att den även uppfyller vissa villkor avseende vetenskaplighet och aktivitet. Vi har inte undersökt utbudet av OA-tidskrifter ämnesmässigt, men Tabell 7 visar en förteckning över de OA-tidskrifter som svenska forskare (på eget eller medförfattares initiativ) publicerat sig i. Det är tydligt att det är tidskrifter inom medicin som dominerar listan. Mest frekvent, med mångdubbelt fler publiceringar än i övriga tidskrifter, har svenska forskare publicerat sig i megatidskriften PLoS ONE, vilken publicerar artiklar inom ett brett naturvetenskapligt spektrum men även täcker in samhällsvetenskaplig forskning. Även inom fördröjd OA är det medicinska tidskrifter som dominerar (Tabell 8), men också multidisciplinära tidskrifter (om än med stor andel medicinska artiklar) återfinns i listan, bland annat prestigetidskriften Proceedings of the National Academy of Sciences (PNAS) som har flest publiceringar av svenska forskare av de tidskrifterna som tillämpar fördröjd OA och Science som även den tillhör en av världens mest ansedda tidskrifter. Tabell 7: Lista på open access-tidskrifter i DOAJ som svenska forskare mest frekvent publicerat sig i 2011. Tidskriftstitel ISSN Antal PLoS ONE 1932-6203 464 BMC Public Health 1471-2458 60 Optics Express 1094-4087 50 Atmospheric Chemistry and Physics 1680-7316 43 PLoS Genetics 1553-7390 29 Nucleic Acids Research 0305-1048 25 International Journal of Qualitative Studies on Health & Well-Being 1748-2623 25 Education Inquiry 2000-4508 23 BMC Cancer 1471-2407 21 New Journal of Physics 1367-2630 21 Biogeosciences 1726-4170 21 BMC Health Services Research 1472-6963 20 Malaria Journal 1475-2875 19 BMC Evolutionary Biology 1471-2148 19 22 Acta Orthopaedica 1745-3674 19 BMC Musculoskeletal Disorders 1471-2474 17 Global Health Action 1654-9880 16 BMC Genomics 1471-2164 15 Upsala Journal of Medical Sciences 0300-9734 15 Acta Dermato-Venereologica 0001-5555 14 Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine 1757-7241 12 Utbildning & Demokrati : Tidsskrift för Didaktik och Utbildningspolitik 1102-6472 11 BMC Infectious Diseases 1471-2334 11 BMC Neuroscience 1471-2202 11 Microbial Cell Factories 1475-2859 11 BMC Research Notes 1756-0500 11 BioResources 1930-2126 10 Journal of Physics : Conference Series 1742-6588 10 Nanoscale Research Letters 1931-7573 10 Ecology and Society 1708-3087 10 Tabell 8: Lista på de tidskrifter med fördröjd open access som svenska forskare mest frekvent publicerat sig i 2011. Tidskriftstitel ISSN Fördröjning (månader) Antal PNAS 0027-8424 6 104 Journal of Biological Chemistry 0021-9258 12 90 Blood 0006-4971 12 65 The Astrophysical Journal 0004-637X 12 49 Acta Oncologica 0284-186X 6 44 Journal of Clinical Endocrinology & Metabolism 0021-972X 12 41 Science 0036-8075 12 30 British Journal of Cancer 0007-0920 12 29 Circulation 0009-7322 12 29 European Heart Journal 0195-668X 12 29 Journal of Immunology 0022-1767 12 27 Journal of Neuroscience 0270-6474 6 26 Diabetes Care 0149-5992 3 26 Diabetes 0012-1797 3 25 Cancer Epidemiology Biomarkers & Prevention 1055-9965 12 24 Human Reproduction 0268-1161 12 24 Human Molecular Genetics 0964-6906 12 24 Nephrology Dialysis Transplantation 0931-0509 12 22 European Journal of Endocrinology 0804-4643 12 21 New England Journal of Medicine 0028-4793 6 21 American Journal of Clinical Nutrition 0002-9165 12 21 23 European Journal of Heart Failure 1388-9842 12 20 Stroke 0039-2499 12 19 Journal of Virology 0022-538X 6 18 Antimicrobial Agents and Chemotherapy 0066-4804 6 18 European Journal of Public Health 1101-1262 12 18 Journal of Physiology 0022-3751 12 18 Anticancer Research 0250-7005 2 17 Annals of Oncology 0923-7534 12 17 5.4 Möjlig OA-publicering enligt SHERPA/RoMEO En undersökning av OA-läget i Sverige (eller världen för den delen) är inte komplett utan att den även undersöker möjligheten att publicera open access. Det gäller utbudet av open access-tidskrifter, men även villkoren för, och möjligheten till, parallellpublicering. Databasen SHERPA/RoMEO innehåller förlags och tidskrifters villkor avseende de rättigheter en författare har till sin egen artikel efter publicering. Vid parallellpublicering är det viktigt att kontrollera villkoren för just den tidskrift man tänker publicera sin artikel i. Villkoren kan variera från tidskrift till tidskrift även inom ett och samma förlag. Databasen är inte heltäckande men de allra flesta av världens vetenskapliga tidskrifter är registrerade där – över 22 000. Av de artiklar som ingår i undersökningsmaterialet återfinns villkor för 85,2 procent i SHERPA/RoMEO (Tabell 9/Figur 4). Tabell 9: Antal och andel artiklar från 2011 med ISSN och villkorsuppgifter i SHERPA/RoMEO. N Antal Andel Poster med ISSN 23905 22892 95,8% Poster med villkorsuppgifter i SHERPA/RoMEO 23905 20371 85,2% Figur 4: Andel artiklar från 2011 med ISSN och med villkorsuppgifter i SHERPA/RoMEO. 4% 11% 85% Poster utan ISSN Poster med ISSN men utan villkorsuppgifter i Sherpa/Romeo Poster med villkorsuppgifter i Sherpa/Romeo 24 Villkoren hos förlagen kan vara detaljrika och komplicerade och är av den anledningen svåra att mäta maskinellt för stora volymer. Sherpa innehåller en grov indelning av förlagen i fyra kategorier: (1) de som tillåter parallellpublicering, (2) de som inte tillåter parallellpublicering, (3) de som tillåter parallellpublicering men med vissa förbehåll och (4) de med okänd status.(Tabell 10). Indelningen är inte utan brister eftersom den avspeglar en komplicerad verklighet men kan ändå ge oss en ungefärlig uppfattning av möjligheterna till parallellpublicering av svenska vetenskapliga artiklar. Olika versioner av en artikel förknippas ofta med olika villkor. En inskickad version är oftast tillåten att parallellpubliceras, men en accepterad eller publicerad version av samma artikel kan vara förbunden med detaljerade villkor även om det är tillåtet. Ofta krävs en speciell notering om ursprungspublicering eller liknande i anslutning till den parallellpublicerade artikeln. Det ställs också villkor på var (i ett institutionellt arkiv eller på en personlig webbsida) en artikel tillåts placeras. I statistiken har vi ansett parallellpublicering vara möjlig (kategorin ”can”) om parallellpublicering varit möjlig av antingen den accepterade versionen, dvs. den peer review-granskade versionen men utan förlagets layout, eller den förlagsutgivna versionen. 59 procent av artiklarna kunde parallellpublicerats enligt SHERPA/RoMEO (Figur 5), endast 2 procent kunde inte parallellpubliceras överhuvudtaget och 36 procent kunde parallellpublicerats men med restriktioner. Om vi slår ihop de som kan parallellpubliceras både utan och med restriktioner blir procentsiffran 95 procent, vilket ligger i linje med resultaten hos tidigare redovisade studier av Hansen (2012) och Laakso (2013). Figur 5: Villkor för de 20371 artiklarna från 2011 med villkorsuppgifter i SHERPA/RoMEO. Tabell 10/Figur 6 visar hur artiklarna i undersökningsmaterialet fördelar sig i förhållande till villkoren i SHERPA/RoMEO samt i vilken mån de parallellpublicerats i de fall det varit tillåtet. Även om indelningen från SHERPA/RoMEO som vi här har använt är mycket grov och verkligheten egentligen är mer komplex, så är det tydligt att det finns utrymme att parallellpublicera betydligt fler artiklar än vad som har gjorts i svenska arkiv av de artiklar som publicerats under 2011. Endast 12,4 procent av de artiklar som enligt 59% 2% 36% 3% can cannot restricted unclear/unknown 25 SHERPA/RoMEO kan parallellpubliceras, antingen författarens version eller förlagets, har parallellpublicerats av något av lärosätena i denna undersökning.44 Även om vi räknar in en andel som säkerligen har parallellpublicerats i ämnesarkiv eller i utländska institutionella arkiv (det utgjorde ca 12 procent i vår manuella undersökning), så kvarstår ett ganska stort utrymme. Tabell 10: Antal och andel artiklar från 2011 med villkorsuppgifter i SHERPA/RoMEO som har parallellpublicerats. Status i SHERPA/RoMEO (PDF eller postprint) N Grön OA Antal Andel can 11986 1486 12,4% Cannot 441 4 0,9% Restricted 7294 366 5,0% unclear/unknown 650 105 16,2% Totalt 20371 1961 9,6% Figur 6: Antal artiklar som har parallellpublicerats av samtliga 20371 artiklar från 2011 med villkorsuppgifter i SHERPA/RoMEO. 44 I appendix finns även villkorsstatus i SHERPA/RoMEO uppdelat per ämneskategori, se Tabell 16, Tabell 17 och Figur 11. can cannot restricted unclear/unk nown Totalt Ej parallellpublicerat 10500 437 6928 545 18410 Antal parallellpublicerade 1486 4 366 105 1961 0 5000 10000 15000 20000 25000 A n t a l a r t i k l a r 26 6 Diskussion 6.1 Definition av OA Denna rapport har kanske inte helt oväntat visat att forskningspublikationer kan göras fritt tillgängliga på webben i många olika former, former som går in i varandra och ibland har flytande gränser. I vissa fall är OA- publiceringen strukturerad, den sker systematiskt genom väletablerade och kontrollerade kanaler och det finns förutsättningar för beständighet över tid. I andra fall sker OA-publicering mindre strukturerat, ofta av enskilda forskare, tämligen godtyckligt i mindre kontrollerade kanaler som inte har några garantier för beständighet. Det fria tillgängliggörandet kan variera vad gäller flera mycket väsentliga aspekter, såsom:  Version som görs tillgänglig  Beständighet av den tillgängliggjorda filen  Infrastruktur för tillgängliggörandet (sökbarhet, navigerbarhet m.m.)  Tidpunkt för tillgängliggörandet Inom de olika sätten att publicera open access kan dessa aspekter variera. För största tillgängighet är det idealt att OA-publiceringen sker direkt, att den slutgiltiga, förlagspublicerade, versionen OA-publiceras, i ett beständigt format och inom ramarna för en god infrastruktur som tillgängliggör publikationen på ett effektivt sätt. Förutom tidpunkten för publicering är det just dessa frågor som tas upp i Berlindeklarationen då den behandlar parallellpublicering. Som nämnts i avsnittet Begrepp och definitioner uttrycker denna att det är den fulla versionen av arbetet som bör parallellpubliceras, att det bör göras i ett standardmässigt elektroniskt format, i ett repositorium av väletablerade organisationer som ämnar tillgängliggöra publikationerna utan restriktioner under lång tid.45 De svenska institutionella arkiv som ingått i undersökningen kan anses uppfylla de villkor som Berlindeklarationen stipulerat. Nämnda kriterier i Berlindeklarationen avser förvisso parallellpublicering men kriterierna kan även vara ett bra verktyg för att titta på övrig OA-publicering och nedan använder vi därför dessa kriterier för att sätta övriga OA-kategorier i undersökningen under luppen. Guld OA-publicering som sker via tidskrifter som är registrerade i DOAJ uppfyller generellt sett kriterierna,46 vilket också gäller för fördröjd OA. Däremot ser det annorlunda ut för åtminstone några av de former för tillgängliggörande som döljer sig bakom kategorin ”annan OA” i denna undersökning. Ämnesarkiv såsom arXiv eller PubMed Central publicerar fulltexter, är beständiga och väletablerade organisationer och uppfyller därmed denna typ av kriterier. Vad gäller fulltexter som hittas på förlagens webbplatser (utöver de tidskrifter som finns i DOAJ eller i listan över de tidskrifter som tillämpar fördröjd OA) så kan vissa av dessa möjligtvis uppfylla kriterierna i Berlindeklarationen, däribland hybrid OA, men för vissa publikationer kan det finnas frågetecken vad gäller beständigheten, däribland tillfälligt tillgängliggörande. För de publikationer som funnits på andra webbplatser såsom forskarnas egna webbsidor och sociala nätverk så uppfylls i regel inte villkoren, antingen är de inte beständiga eller så ges de inte ut av väletablerade organisationer. Det kan här vara värt att nämna att vid en uppföljande 45 http://openaccess.mpg.de/286432/Berlin-Declaration. I deklarationen finns även ett grundkrav på återanvändning av artiklarna (s.k. libre OA). Den aspekten har vi inte mätt i vår studie, och det har såvitt vi kunnat se, ingen annan ännu gjort heller. Problematiken kring libre OA och t.ex. CC-licensers användning för OA är också en tämligen komplex fråga. Därför bortser vi från det grundkravet i vår diskussion. 46 Det finns naturligtvis tidskrifter listade i DOAJ som ges ut av mindra väletablerade kanaler och som är mindre beständiga, dock publicerar sådana tidskrifter troligtvis en liten del av publikationerna inom kategorin Guld OA i denna undersökning. I listan över de OA-tidskrifter i DOAJ som svenska forskare mest frekvent publicerat sig i (Tabell 7) dominerar tydligt tidskrifter från väletablerade förlag. 27 undersökning av grön OA på olika platser, fann Björk et al att tre år efter den ursprungliga undersökningen, var endast 56 procent av artiklarna på hemsidor (personliga eller institutionens) kvar, medan siffran för institutionella arkiv var 80 procent och för ämnesarkiv 95 procent. Ungefär hälften av de försvunna artiklarna kunde hittas på nya webbadresser. 47 Men undersökningen visar på beständighetens värde i OA-sammanhang. Den kategori OA som i denna studie benämns fördröjd OA kan diskuteras ur andra aspekter än beständighet och Berlindeklarationens kriterier. Fördröjd fri tillgång har setts som ett steg på vägen mot omedelbar OA, bättre än enbart avgiftsbelagd tillgång. Fördröjning eller embargo har oftast varit associerad med grön OA och även i relativt hög grad accepterats i samband med det. Det har inte setts som lika givet att betrakta det som egentlig OA vad gäller artiklar på tidskriftens egen hemsida. Men det går att hävda att det på ett sätt är att föredra framför embargobelagd grön OA, eftersom fördröjd OA i tidskriften ger tillgång till förlagsversionen snarare än författarmanuskriptet.48 Sett ur ett rent logiskt perspektiv är det alltså ingen självklarhet varför embargo för grön OA skulle accepteras, men inte fördröjning i tidskrifter. Men även om det ofta brukar hävdas att OA inte är en affärsmodell i sig, utan kan inbegripa olika modeller,49 så är det kanske tveksamt om just prenumerationsmodellen kan innefattas av konceptet OA. Det kan hur som helst konstateras att man måste förhålla sig till tidskrifters fördröjd OA vid mätningar, oavsett om man tycker det är riktig OA eller inte. 6.2 ”Tipping point”? Archambault et al. menar att den vetenskapliga publiceringen har nått en avgörande punkt (”tipping point”) vad gäller open access-publicering i världen.50 De definierar denna avgörande punkt som att OA- publiceringen överstiger 50 procent. Förutom denna operationalisering av begreppet diskuterar dock inte rapporten vad denna avgörande punkt egentligen innebär. En tolkning kan vara att om OA-publiceringen överstiger den traditionella publiceringen så har vi nått en punkt där en omställning till OA-publicering kommer att eskalera i hastighet. En sådan tolkning tar dock inte i beaktande den komplexa bild som skissades upp i Venn-diagrammet i Figur 1 (s. 8) och som resultaten i denna undersökning visar på. Archambault et al. uppskattar den svenska publiceringen i OA-tidskrifter (utifrån ett statistiskt urval av Scopus-data) till ca 8 (± 1) procent. Den uppskattningen ligger inte långt ifrån det värde som vi kommit fram till, om 10,4 procent. Vidare uppskattar rapporten från Science-Metrix att grön och hybrid OA skulle uppgå till 40 (± 2) procent (utöver eventuellt överlapp mellan guld och grön). Denna kategori är tyvärr dåligt definierad och överhuvud taget inte transparent. I det slumpvisa urvalet som vi gjorde kunde vi hitta ca 52 procent av artiklarna fritt tillgängliga någonstans på webben. Denna siffra ligger nära den som Science-Metrix kommit fram till. Huruvida samtliga dessa rör sig om OA-publicering, beror dock på hur detta begrepp definieras. Om vi exempelvis exkluderar några tveksamma OA-typer som fördröjd OA och egna hemsidor/sociala medier, men inkluderar ämnesarkiv och utländska institutionella arkiv, hamnar siffran för svensk OA 2011 på ca 28 procent totalt, i vår manuella urvalsundersökning (om vi schablonräknar bort ca 2 procentenheters överlapp). Eftersom guld och grön OA i både den statistiska och den manuella 47 Björk et al (2014). 48 Laakso & Björk (2013). Suber (2012) framhåller endast fördröjning som acceptabel i samband med grön OA och monografier. Se s. 60 och 110. 49 Se t.ex. Open Access Scholarly Information Sourcebook (OASIS): ”Open Access is a means of delivering content to users, not a business model.” http://www.openoasis.org/index.php?option=com_content&view=article&id=358&Itemid=263 50 Archambault et al (2013). 28 undersökningen ligger nära varandra, kanske det inte är alltför långt ifrån sanningen. Klart är i alla fall att en stor del av svensk forskning finns tillgänglig ett par år efter publicering. Att en stor del av forskningen på olika sätt tillgängliggörs någon gång efter publicering och innan två år har passerats betyder dock nödvändigtvis inte att ett skifte skett vad gäller den vetenskapliga publiceringens infrastruktur och form. Det är förvisso uppenbart att den vetenskapliga publiceringen genomgår stora förändringar, delvis på grund av de förändrade möjligheter som den teknologiska utvecklingen har erbjudit. Men genom att använda ordet ”tipping point” föreslås att ett skifte håller på att ske från traditionellt finansierad publicering till OA-publicering, vilket ger bilden av en linjär process där en publiceringsform övergår till en annan. De flesta av de olika formerna för OA-publicering sker dock inom ramarna för den traditionella vetenskapliga publiceringen som baseras på prenumerationsbaserad tidskriftsutgivning. Det gäller parallellpubliceringen (åtminstone majoriteten av denna), hybrid-tidskrifter, fördröjd OA och även den kategori som vi har kallat ”annan OA”. Vi vill därför hävda en viss försiktighet i att tolka en ökande andel fritt tillgängliga vetenskapliga publikationer som en omedelbart förestående omställning av finansieringen av publiceringen. Istället ser vi en bild där OA- publiceringen har antagit högst varierande former och tillgängliggörandet av vetenskapliga artiklar sker på många olika sätt. Vi har inte undersökt tidpunkten för när det öppna tillgängliggörandet för artiklarna i undersökningen har skett, men för majoriteten av artiklarna kan vi anta att den skett någon gång efter att artikeln publicerats i en traditionellt finansierad tidskrift, dvs. inte omedelbart. Utifrån den uppmätta andelen OA-publicerade artiklar får vi förvisso några ledtrådar om var den vetenskapliga publiceringen är på väg, men vi kan inte utifrån denna dra några slutsatser om hur den vetenskapliga publiceringen förändras i grunden, det krävs mer omfattande studier som tittar på fler aspekter av hur publiceringen sker för att detta ska vara möjligt. 6.3 Rekommendationer för framtida mätningar av svensk OA-publicering Detta projekt har inte haft som syfte att specificera hur en svensk open access-statistik bör tas fram i framtiden. Dock har ett av syftena varit att dra lärdomar som kan vara av nytta för utformningen av framtida kontinuerliga uppföljningar av OA-publiceringen i Sverige. Nedan följer därför några sådana lärdomar från detta projekt, vilka behandlar olika aspekter utifrån de resultat som framkommit i denna undersökning. Swepub utgör en bra grund för mätning av svensk OA-publicering eftersom databasen innehåller publikationsposter utöver de som finns i Web of Science och Scopus och därför potentiellt sett har färre problem med sämre täckning inom vissa ämnesområden än inom andra. Idag finns visserligen vissa frågetecken kring kvaliteten i Swepub eftersom Swepub tidigare inte använts för att ta fram statistik och därmed inte utvärderats utifrån ett sådant användningsområde. I och med Kungliga bibliotekets tidigare nämnda uppdrag att vidareutveckla Swepub har dock ett kvalitetssäkrande arbete påbörjats. Att i fortsättningen utgå från Swepub vid analyser ger bättre förutsättningar att täcka hela den svenska forskningen än genom att använda globala databaser såsom Web of Science eller Scopus. Vidare ger det möjligheter att på sikt även inkludera andra publikationstyper vid studier av svensk OA-publicering. Det faktum att ett par större lärosäten ännu inte levererar data till Swepub innebär dock att alternativa källor fortfarande kommer att behövas. Genom att använda Swepub finns även möjligheter att påverka och därmed höja kvalitén på de data som används för analyser av svensk OA-publicering. Det gäller grundläggande aspekter såsom att få fullständig täckning av lärosätenas publicering, att affiliering görs efter samma principer och på ett maskinellt läsbart sätt, 29 att posterna (då det är applicerbart) ska innehålla korrekta ISSN och att märkning av publikationstyp, publiceringsstatus och refereegranskning ska vara korrekt. Men det skulle även kunna gälla praxis för parallellpublicering, vilken version som parallellpubliceras, uppmärkning av datum för parallellpubliceringen samt uppmärkning av version som har parallellpublicerats. Det pågår i skrivande stund internationellt arbete för att standardisera vokabulärer och metadata för OA. SwePub och de lokala publikationsdatabaserna bör följa detta arbete och följa de standarder som antas internationellt.51 Vidare bör tidpunkten för OA-publiceringen tas i beaktande vid eventuella framtida mätningar. Återkommande mätningar bör, för att resultaten ska vara jämförbara, använda fasta tidsfönster så att olika publiceringsår mäts med lika långa tidsfönster. Generellt vid mätningar av OA-publicering är det av vikt att man tydligt definierar vad det är man avser att mäta. Det är väsentligt att kunna skilja på olika former av OA-publicering i statistiken för att kunna dra slutsatser om vart OA-publiceringen är på väg. Man bör också överväga att använda kriterier för vilka former som ska betraktas som egentlig OA. Detta är inte minst av vikt om man ser mätningar av fenomen som detta som incitamentsskapande. Troligtvis vill man ge incitament till OA-publicering i kontrollerade, beständiga och effektivt tillgängliggörande kanaler, och rimligen bör former som inte anses uppfylla sådana kriterier inte räknas med då OA-publiceringen mäts. Konkret menar vi att fritt tillgängliga artiklar på hemsidor utanför etablerade arkiv (som t.ex. personliga hemsidor, institutionshemsidor och sociala medier) inte bör medräknas i framtida mätningar. Vi vill även sätta ett frågetecken för kategorin fördröjd OA. 51 National Information Standards Organization (NISO): Open Access Metadata and Indicators (pågående projekt). http://www.niso.org/workrooms/oami . Se även: JISC, Vocabularies for Open Access: http://www.jisc.ac.uk/whatwedo/topics/digitallibraries/pals-group/v4oa.aspx 30 7 Referenser Archambault, É., Amyot, D., Deschamps, P., Nicol, A., Rebout, L. Roberge, G. (2013). Proportion of Open Access - Peer-Reviewed Papers at the European and World Levels 2004-2011. Science-Metrix. European Commission DG Research & Innovation RTD-B6-PP-2011-2: Study to develop a set of indicators to measure open access. http://www.science-metrix.com/pdf/SM_EC_OA_Availability_2004-2011.pdf (Hämtad 2014-03-15). Archambault, É. & Beauchesne, O. (2011a). Ontology of Scientific Journals (v1.01). Science-Metrix. http://www.science-metrix.com/eng/tools.htm (Hämtad 2014-03-15). Archambault, É., Beauchesne, O. & Caruso, J. (2011b). Towards a Multilingual, Comprehensive and Open Scientific Journal Ontology. In Proceedings of the 13th International Conference of the International Society for Scientometrics and Informetrics (ISSI) (pp. 66–77). Durban, South Africa. http://www.science- metrix.com/pdf/Towards_a_Multilingual_Comprehensive_and_Open.pdf (Hämtad 2014-03-15). Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 2003, http://openaccess.mpg.de/286432/Berlin-Declaration (Hämtad 2014-03-15). Björk, B-C. (2012). The hybrid model for open access publication of scholarly articles: A failed experiment? Journal of the American Society for Information Science and Technology. 63(8), pp: 1496-1504. doi:10.1002/asi.22709. Björk, B.-C., Laakso, M., Welling, P., Paetau, P. (2014). Anatomy of green open access. Journal of the Association for Information Science and Technology, 65(2), pp. 237–250. doi: 10.1002/asi.22963. Björk, B-C., Roos, A. & Lauri, M. (2009). Scientific journal publishing: yearly volume and open access availability. Information Research, 14(1) paper 391. http://www.informationr.net/ir/14-1/paper391.html (Hämtad 2014-03-15). Björk, B-C., Welling, P., Laakso, M., Majlender, P., Hedlund, T. & Guðnason, G. (2010). Open Access to the Scientific Journal Literature: Situation 2009. PLoS ONE, 5(6), e11273. doi:10.1371/journal.pone.0011273 Dallmeier-Thiessen, S., Goerner, B., Darby, R., Hyppoelae, J., Igo-Kemenes, P., Kahn, D., …, & van der Stelt, W. (2010). Open access publishing : models and attributes. SOAP project report. Max Planck digital library. http://edoc.mpg.de/478647 (Hämtad 2014-03-15). Elbæk, M. K., Hansen, T.J., Larsen, A.V., Melbye, A.T., Schelde, S.L., Dorch, B.F. (2014). Open Access kortlægning 2011: en analyse af universiteternes BFI-publikationer 2011. DEFF (Danmarks Elektroniske Fag- og Forskningsbibliotek). https://infoshare.dtv.dk/twiki/pub/OpenAccessBarometer/WebHome/OA_Barometerets_Open_A Acces_kortlgning_2011.pdf (Hämtad 2014-04-06). Elsevier (2013). International Comparative Performance of the UK Research Base – 2013 : A report prepared by Elsevier for the UK’s Department of Business, Innovation and Skills (BIS). https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/263729/bis-13- 1297-international-comparative-performance-of-the-UK-research-base-2013.pdf (Hämtad 2014-03-12). European Commission (2012). Towards better access to scientific information: Boosting the benefits of public investments in research: 31 http://ec.europa.eu/research/sciencesociety/document_library/pdf_06/era-communication-towards- better-access-to-scientific-information_en.pdf (Hämtad: 2014-03-12). Forskning och innovation, Prop. 2012/13:30, http://www.regeringen.se/sb/d/15650/a/201368 (Hämtad 2014-03-15). Gargouri, Y., Lariviere, V., Gingras, Y., Carr, L. & Harnad, S. (2012). Green and Gold Open Access percentages and growth, by discipline. In, 17th International Conference on Science and Technology Indicators (STI), Montréal, CA, 05 - 08 Sep 2012. http://eprints.soton.ac.uk/340294/ (Hämtad 2014-03-12). Hajjem, C., Harnad, S., Gingras, Y. (2005). Ten-Year Cross-Disciplinary Comparison of the Growth of Open Access and How it Increases Research Citation Impact. IEEE Data Engineering Bulletin, 28(4), pp: 39- 47. http://sites.computer.org/debull/A05dec/hajjem.pdf (Hämtad: 2014-03-12). Hansen, D. (2012). Understanding and making use of academic authors’ open access rights. Journal of Librarianship and Scholarly Communication, 1(2), eP1050. doi: 10.7710/2162-3309.1050. Hedlund, T. (2010). Open Access availability of articles by Nordic authors. ScieCom Info, 6(4). http://www.sciecom.org/ojs/index.php/sciecominfo/article/view/4760 (Hämtad: 2014-03-12). Laakso, M. (2013). Green open access policies of scholarly journal publishers: a study of what, when, and where self-archiving is allowed. Scientometrics. Published online: 13 December 2013. doi:10.1007/s11192-013-1205-3. Laakso, M. & Björk, B-C. (2012). Anatomy of open access publishing: a study of longitudinal development and internal structure. BMC Medicine 2012, 10:124. DOI:10.1186/1741-7015-10-124 Laakso, M. & Björk, B-C. (2013). Delayed open access: An overlooked high-impact category of openly available scientific literature. Journal of the American Society for Information Science and Technology, 64(7), 1323–1329. Doi: 10.1002/asi.22856. McVeigh, M. (2004). Open Access Journals in the ISI Citation Databases: Analysis of Impact Factors and Citation Patterns: A citation study from Thomson Scientific. http://ip-science.thomsonreuters.com/m/pdfs/openaccesscitations2.pdf (Hämtad 2014-03-12). Memorandum for the Heads of Executive Departments and Agencies (2013). http://www.whitehouse.gov/sites/default/files/microsites/ostp/ostp_public_access_memo_2013.pdf (Hämtad: 2014-03-15). National Principles for Open Access Policy Statement Ireland (2012): http://www.iua.ie/wp- content/uploads/2012/10/National-Principles-on-Open-Access-Policy-Statement-FINAL-23-Oct- 2012-v1-3.pdf (Hämtad 2014-03-15). Norman, U. & Scheutz, D. (2013). Kvalitet, enhetlighet och täckning : granskning av lokala publikationsdatabaser. Kungl. biblioteket. http://openaccess.blogg.kb.se/files/2013/10/Kvalitet_enhetlighet_och_tackning_slutrapport_2013- 10-11.pdf (Hämtad 2014-03-15). Sandewall, E. (2012). OA-publicerade domänmodeller avseende vetenskaplig publicering och gruppstruktur. Slutrapport för PARPUB-projektet Fas I och II. Kungl. biblioteket. http://www.kb.se/Dokument/Om/projekt/open_access/2012/parpub_huvudrapport.pdf (Hämtad 2014-03-13). Suber, P. (2012). Open Access. MIT Press. (Elektronisk version: bit.ly/oa-book) 32 Svensson, A. (2011). Open access vid svenska lärosäten : en enkätundersökning. Kungl biblioteket. http://www.kb.se/dokument/Om/projekt/open_access/2011/OA%20enkat%2020111010.pdf (Hämtad 2014-03-13). Svensson, A. (2012). Vidareutveckling av parallellpublicering : automatisk uppslagstjänst och versionshantering i öppna arkiv. Kungl. biblioteket. http://www.kb.se/Dokument/Om/projekt/open_access/2012/publiceringsr%C3%A4ttigheter_vidar eutveckling_rapport.pdf (Hämtad 2014-03-13). Willetts, D., (2012). Letter to Dame Janet Finch on the Government Response to the Finch Group Report: “Accessibility, sustainability, excellence: how to expand access to research publications”. https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/32493/12-975- letter-government-response-to-finch-report-research-publications.pdf (Hämtad 2014-03-15). Webbsidor: arXiv: http://arxiv.org/ Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities: http://openaccess.mpg.de/286432/Berlin-Declaration Bibliometrisk Forskningsindikator, Danmark (BFI): http://fivu.dk/forskning-og-innovation/statistik-og- analyser/den-bibliometriske-forskningsindikator Creative Commons: http://www.creativecommons.se/om-cc/licenserna/ Dansk OA-barometer: http://projekter.bibliotekogmedier.dk/projekt/dansk-open-access-barometer Dansk OA-barometer wiki: https://infoshare.dtv.dk/twiki/bin/view/OpenAccessBarometer Den Danske Forskningsdatabase: http://www.forskningsdatabasen.dk/ Directory of Open Access Journals: http://www.doaj.org/ Jisc, Vocabularies for Open Access: http://www.jisc.ac.uk/whatwedo/topics/digitallibraries/pals- group/v4oa.aspx National Information Standards Organization (NISO), Open Access Metadata and Indicators: http://www.niso.org/workrooms/oami Nordbib, OA-barometer 2009: http://www.nordbib.net/Projects/OA-barometer-2009.aspx Open Access Scholarly Information Sourcebook (OASIS): http://www.openoasis.org/ Pubmed Central: http://www.ncbi.nlm.nih.gov/pmc/ ResearchGate: http://www.researchgate.net/ Sherpa: http://www.sherpa.ac.uk SwePub: http://www.swepub.se/; http://www.kb.se/libris/teknisk-information/SwePub/ Vetenskapsrådet: http://www.vr.se 33 8 Appendix 8.1 Resultat uppdelat per lärosäte Tabell 11: Antal och andel artiklar från 2011 som finns tillgängliga open access redovisat per lärosäte. Lärosäte N Guld eller grön Guld, grön eller fördröjd Antal Andel Antal Andel Blekinge tekniska högskola 91 30 33,0% 30 33,0% Chalmers tekniska högskola 1297 334 25,8% 352 27,1% Ersta Sköndal högskola 31 6 19,4% 6 19,4% Försvarshögskolan 29 1 3,4% 1 3,4% Gymnastik- och idrottshögskolan 36 3 8,3% 8 22,2% Göteborgs universitet* 3015 319 10,6% 623 20,7% Högskolan Dalarna 125 19 15,2% 27 21,6% Högskolan Kristianstad 75 27 36,0% 27 36,0% Högskolan Väst 54 6 11,1% 6 11,1% Högskolan i Borås* 156 30 19,2% 30 19,2% Högskolan i Gävle 84 13 15,5% 14 16,7% Högskolan i Halmstad 116 28 24,1% 29 25,0% Högskolan i Jönköping 216 31 14,4% 31 14,4% Högskolan i Skövde 145 27 18,6% 36 24,8% Högskolan på Gotland 12 4 33,3% 4 33,3% Karlstads universitet* 165 20 12,1% 21 12,7% Karolinska institutet* 4039 529 13,1% 1310 32,4% Kungliga tekniska högskolan 2162 230 10,6% 282 13,0% Linköpings universitet 1689 631 37,4% 727 43,0% Linnéuniversitetet 337 50 14,8% 60 17,8% Luleå tekniska universitet* 521 105 20,2% 108 20,7% Lunds universitet 4192 803 19,2% 1161 27,7% Malmö högskola 195 56 28,7% 58 29,7% Mittuniversitetet 293 43 14,7% 48 16,4% Mälardalens högskola 190 34 17,9% 37 19,5% Sophiahemmet högskola 17 0 0,0% 1 5,9% Stockholms universitet 2255 339 15,0% 480 21,3% Sveriges lantbruksuniversitet* 1189 140 11,8% 223 18,8% Södertörns högskola 113 15 13,3% 18 15,9% Umeå universitet 1699 320 18,8% 510 30,0% Uppsala universitet 3931 489 12,4% 896 22,8% Örebro universitet 393 53 13,5% 84 21,4% * Undantag gäller för dataunderlaget, se rubriken Undantag av dataunderlag och manuella tillägg, s.11. 34 Tabell 12: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. Lärosäte N Guld Grön Fördröjd Överlapp guld/grön Överlapp grön/fördröjd Ej OA Blekinge tekniska högskola 91 8 27 0 -5 0 61 Chalmers tekniska högskola 1297 111 307 21 -84 -3 945 Ersta Sköndal högskola 31 5 2 0 -1 0 25 Försvarshögskolan 29 0 1 0 0 0 28 Gymnastik- och idrottshögskolan 36 2 3 5 -2 0 28 Göteborgs universitet* 3015 278 112 306 -71 -2 2392 Högskolan Dalarna 125 17 6 8 -4 0 98 Högskolan Kristianstad 75 16 26 0 -15 0 48 Högskolan Väst 54 6 0 0 0 0 48 Högskolan i Borås* 156 23 9 0 -2 0 126 Högskolan i Gävle 84 10 4 1 -1 0 70 Högskolan i Halmstad 116 21 13 1 -6 0 87 Högskolan i Jönköping 216 22 15 0 -6 0 185 Högskolan i Skövde 145 27 1 9 -1 0 109 Högskolan på Gotland 12 2 2 0 0 0 8 Karlstads universitet* 165 19 3 1 -2 0 144 Karolinska institutet* 4039 526 4 782 -1 -1 2729 Kungliga tekniska högskolan 2162 164 82 53 -16 -1 1880 Linköpings universitet 1689 184 535 123 -88 -27 962 Linnéuniversitetet 337 41 11 10 -2 0 277 Luleå tekniska universitet* 521 57 75 4 -27 -1 413 Lunds universitet 4192 419 600 403 -216 -45 3031 Malmö högskola 195 20 50 2 -14 0 137 Mittuniversitetet 293 28 19 5 -4 0 245 Mälardalens högskola 190 22 13 4 -1 -1 153 Sophiahemmet högskola 17 0 0 1 0 0 16 Stockholms universitet 2255 247 132 150 -40 -9 1775 Sveriges lantbruksuniversitet* 1189 111 35 85 -6 -2 966 Södertörns högskola 113 12 4 3 -1 0 95 Umeå universitet 1699 252 147 193 -79 -3 1189 Uppsala universitet 3931 420 128 411 -59 -4 3035 Örebro universitet 393 43 14 32 -4 -1 309 * Undantag gäller för dataunderlaget, se rubriken Undantag av dataunderlag och manuella tillägg, s.11. 35 Tabell 13: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. Lärosäte N Guld Grön Fördröjd Överlapp guld/grön Överlapp grön/fördröjd Ej OA Summa Blekinge tekniska högskola 91 8,8% 29,7% 0,0% -5,5% 0,0% 67,0% 100% Chalmers tekniska högskola 1297 8,6% 23,7% 1,6% -6,5% -0,2% 72,9% 100% Ersta Sköndal högskola 31 16,1% 6,5% 0,0% -3,2% 0,0% 80,6% 100% Försvarshögskolan 29 0,0% 3,4% 0,0% 0,0% 0,0% 96,6% 100% Gymnastik- och idrottshögskolan 36 5,6% 8,3% 13,9% -5,6% 0,0% 77,8% 100% Göteborgs universitet* 3015 9,2% 3,7% 10,1% -2,4% -0,1% 79,3% 100% Högskolan Dalarna 125 13,6% 4,8% 6,4% -3,2% 0,0% 78,4% 100% Högskolan Kristianstad 75 21,3% 34,7% 0,0% -20,0% 0,0% 64,0% 100% Högskolan Väst 54 11,1% 0,0% 0,0% 0,0% 0,0% 88,9% 100% Högskolan i Borås* 156 14,7% 5,8% 0,0% -1,3% 0,0% 80,8% 100% Högskolan i Gävle 84 11,9% 4,8% 1,2% -1,2% 0,0% 83,3% 100% Högskolan i Halmstad 116 18,1% 11,2% 0,9% -5,2% 0,0% 75,0% 100% Högskolan i Jönköping 216 10,2% 6,9% 0,0% -2,8% 0,0% 85,6% 100% Högskolan i Skövde 145 18,6% 0,7% 6,2% -0,7% 0,0% 75,2% 100% Högskolan på Gotland 12 16,7% 16,7% 0,0% 0,0% 0,0% 66,7% 100% Karlstads universitet* 165 11,5% 1,8% 0,6% -1,2% 0,0% 87,3% 100% Karolinska institutet* 4039 13,0% 0,1% 19,4% 0,0% 0,0% 67,6% 100% Kungliga tekniska högskolan 2162 7,6% 3,8% 2,5% -0,7% 0,0% 87,0% 100% Linköpings universitet 1689 10,9% 31,7% 7,3% -5,2% -1,6% 57,0% 100% Linnéuniversitetet 337 12,2% 3,3% 3,0% -0,6% 0,0% 82,2% 100% Luleå tekniska universitet* 521 10,9% 14,4% 0,8% -5,2% -0,2% 79,3% 100% Lunds universitet 4192 10,0% 14,3% 9,6% -5,2% -1,1% 72,3% 100% Malmö högskola 195 10,3% 25,6% 1,0% -7,2% 0,0% 70,3% 100% Mittuniversitetet 293 9,6% 6,5% 1,7% -1,4% 0,0% 83,6% 100% Mälardalens högskola 190 11,6% 6,8% 2,1% -0,5% -0,5% 80,5% 100% Sophiahemmet högskola 17 0,0% 0,0% 5,9% 0,0% 0,0% 94,1% 100% Stockholms universitet 2255 11,0% 5,9% 6,7% -1,8% -0,4% 78,7% 100% Sveriges lantbruksuniversitet* 1189 9,3% 2,9% 7,1% -0,5% -0,2% 81,2% 100% Södertörns högskola 113 10,6% 3,5% 2,7% -0,9% 0,0% 84,1% 100% Umeå universitet 1699 14,8% 8,7% 11,4% -4,7% -0,2% 70,0% 100% Uppsala universitet 3931 10,7% 3,3% 10,5% -1,5% -0,1% 77,2% 100% Örebro universitet 393 10,9% 3,6% 8,1% -1,0% -0,3% 78,6% 100% * Undantag gäller för dataunderlaget, se rubriken Undantag av dataunderlag och manuella tillägg, s.11. 36 Figur 7: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte. * * Undantag i dataunderlaget gäller för några lärosäten, se rubriken Undantag av dataunderlag och manuella tillägg, s.11 0% 20% 40% 60% 80% 100% Örebro universitet Uppsala universitet Umeå universitet Södertörns högskola Sveriges lantbruksuniversitet Stockholms universitet Sophiahemmet högskola Mälardalens högskola Mittuniversitetet Malmö högskola Lunds universitet Luleå tekniska universitet Linnéuniversitetet Linköpings universitet Kungliga tekniska högskolan Karolinska institutet Karlstads universitet Högskolan Väst Högskolan på Gotland Högskolan Kristianstad Högskolan i Skövde Högskolan i Jönköping Högskolan i Halmstad Högskolan i Gävle Högskolan i Borås Högskolan Dalarna Göteborgs universitet Gymnastik- och idrottshögskolan Försvarshögskolan Ersta Sköndal högskola Chalmers tekniska högskola Blekinge tekniska högskola Ej OA Fördröjd Grön och fördröjd Grön Guld och grön Guld 37 Figur 8: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per lärosäte.* * Undantag i dataunderlaget gäller för några lärosäten, se rubriken Undantag av dataunderlag och manuella tillägg, s.11. 0 500 1000 1500 2000 2500 3000 3500 4000 4500 Örebro universitet Uppsala universitet Umeå universitet Södertörns högskola Sveriges lantbruksuniversitet Stockholms universitet Sophiahemmet högskola Mälardalens högskola Mittuniversitetet Malmö högskola Lunds universitet Luleå tekniska universitet Linnéuniversitetet Linköpings universitet Kungliga tekniska högskolan Karolinska institutet Karlstads universitet Högskolan Väst Högskolan på Gotland Högskolan Kristianstad Högskolan i Skövde Högskolan i Jönköping Högskolan i Halmstad Högskolan i Gävle Högskolan i Borås Högskolan Dalarna Göteborgs universitet Gymnastik- och idrottshögskolan Försvarshögskolan Ersta Sköndal högskola Chalmers tekniska högskola Blekinge tekniska högskola Ej OA Fördröjd Grön och fördröjd Grön Guld och grön Guld 38 8.2 Resultat per ämne Tabell 14: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. Domän Fält N Guld Grön Fördröjd Guld och grön Grön och fördröjd Ej OA Saknar ämneskategori 4888 769 536 136 190 5 3642 Allmän Allmän humaniora 20 0 1 0 0 0 19 Allmän vetenskap 543 466 136 34 134 1 42 Kulturvetenskap Estetiska vetenskaper 9 0 1 0 0 0 8 Filosofi och teologi 80 2 6 0 2 0 74 Historiska vetenskaper 214 8 4 0 1 0 203 Språk och kommunikationsvetenskap 73 1 3 0 0 0 69 Medicinska vetenskaper Beteendevetenskap 347 13 17 19 2 0 300 Biomedicinska vetenskaper 1853 185 119 607 41 29 1012 Hälsovetenskap 1078 134 132 101 56 3 770 Klinisk medicin 5805 383 446 1012 144 46 4154 Naturvetenskap Biologiska vetenskaper 821 43 33 79 17 3 686 Fysik och astronomi 2216 95 356 49 28 5 1749 Geovetenskap 672 122 52 0 27 0 525 Kemivetenskap 886 21 50 7 3 1 812 Matematiska vetenskaper 325 12 27 0 1 0 287 Samhälls- vetenskap Ekonomiska vetenskaper 525 3 23 0 1 0 500 Samhällsvetenskap 511 22 37 0 4 0 456 Tekniska vetenskaper Agrikulturella vetenskaper 560 24 21 18 0 1 498 Designvetenskaper 129 1 7 0 0 0 121 Generiska teknologier 1200 129 121 24 48 2 976 Informations- och kommunikationsteknologi 463 45 101 2 14 0 329 Ingenjörsvetenskap 687 17 60 0 2 0 612 Totalt 23905 2495 2289 2088 715 96 17844 39 Tabell 15: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. Domän Fält N Guld Grön Fördröjd Guld och grön Grön och fördröjd Ej OA Totalt Saknar ämneskategori 4888 15,7% 11,0% 2,8% -3,9% -0,1% 74,5% 100% Allmän Allmän humaniora 20 0,0% 5,0% 0,0% 0,0% 0,0% 95,0% 100% Allmän vetenskap 543 85,8% 25,0% 6,3% -24,7% -0,2% 7,7% 100% Kulturvetenskap Estetiska vetenskaper 9 0,0% 11,1% 0,0% 0,0% 0,0% 88,9% 100% Filosofi och teologi 80 2,5% 7,5% 0,0% -2,5% 0,0% 92,5% 100% Historiska vetenskaper 214 3,7% 1,9% 0,0% -0,5% 0,0% 94,9% 100% Språk och kommunikationsvetenskap 73 1,4% 4,1% 0,0% 0,0% 0,0% 94,5% 100% Medicinska vetenskaper Beteendevetenskap 347 3,7% 4,9% 5,5% -0,6% 0,0% 86,5% 100% Biomedicinska vetenskaper 1853 10,0% 6,4% 32,8% -2,2% -1,6% 54,6% 100% Hälsovetenskap 1078 12,4% 12,2% 9,4% -5,2% -0,3% 71,4% 100% Klinisk medicin 5805 6,6% 7,7% 17,4% -2,5% -0,8% 71,6% 100% Naturvetenskap Biologiska vetenskaper 821 5,2% 4,0% 9,6% -2,1% -0,4% 83,6% 100% Fysik och astronomi 2216 4,3% 16,1% 2,2% -1,3% -0,2% 78,9% 100% Geovetenskap 672 18,2% 7,7% 0,0% -4,0% 0,0% 78,1% 100% Kemivetenskap 886 2,4% 5,6% 0,8% -0,3% -0,1% 91,6% 100% Matematiska vetenskaper 325 3,7% 8,3% 0,0% -0,3% 0,0% 88,3% 100% Samhälls- vetenskap Ekonomiska vetenskaper 525 0,6% 4,4% 0,0% -0,2% 0,0% 95,2% 100% Samhällsvetenskap 511 4,3% 7,2% 0,0% -0,8% 0,0% 89,2% 100% Tekniska vetenskaper Agrikulturella vetenskaper 560 4,3% 3,8% 3,2% 0,0% -0,2% 88,9% 100% Designvetenskaper 129 0,8% 5,4% 0,0% 0,0% 0,0% 93,8% 100% Generiska teknologier 1200 10,8% 10,1% 2,0% -4,0% -0,2% 81,3% 100% Informations- och kommunikationsteknologi 463 9,7% 21,8% 0,4% -3,0% 0,0% 71,1% 100% Ingenjörsvetenskap 687 2,5% 8,7% 0,0% -0,3% 0,0% 89,1% 100% Totalt 23905 10,4% 9,6% 8,7% -3,0% -0,4% 74,6% 100% 40 Figur 9: Andel artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. 0% 20% 40% 60% 80% 100% Ingenjörsvetenskap Informations- och kommunikationsteknologi Generiska teknologier Designvetenskaper Agrikulturella vetenskaper Samhällsvetenskap Ekonomiska vetenskaper Matematiska vetenskaper Kemivetenskap Geovetenskap Fysik och astronomi Biologiska vetenskaper Klinisk medicin Hälsovetenskap Biomedicinska vetenskaper Beteendevetenskap Språk och kommunikationsvetenskap Historiska vetenskaper Filosofi och teologi Estetiska vetenskaper Allmän vetenskap Allmän humaniora Utan ämneskatetori T e k n i s k a v e t e n s k a p e r S a m h ä l l s v e t e n s k a p N a t u r v e t e n s k a p M e d i c i n s k a v e t e n s k a p e r K u l t u r v e t e n s k a p A l l m ä n Ej OA Fördröjd Grön och fördröjd Grön Guld och grön Guld 41 Figur 10: Antal artiklar från 2011 som finns tillgängliga open access uppdelat på guld, grön och fördröjd open access och redovisat per ämne enligt Science-Metrix tidskriftklassifikation. 0 1000 2000 3000 4000 5000 6000 7000 Ingenjörsvetenskap Informations- och kommunikationsteknologi Generiska teknologier Designvetenskaper Agrikulturella vetenskaper Samhällsvetenskap Ekonomiska vetenskaper Matematiska vetenskaper Kemivetenskap Geovetenskap Fysik och astronomi Biologiska vetenskaper Klinisk medicin Hälsovetenskap Biomedicinska vetenskaper Beteendevetenskap Språk och kommunikationsvetenskap Historiska vetenskaper Filosofi och teologi Estetiska vetenskaper Allmän vetenskap Allmän humaniora Utan ämneskatetori T e k n i s k a v e t e n s k a p e r S a m h ä l l s v e t e n s k a p N a t u r v e t e n s k a p M e d i c i n s k a v e t e n s k a p e r K u l t u r v e t e n s k a p A l l m ä n Ej OA Fördröjd Grön och fördröjd Grön Guld och grön Guld 42 Tabell 16: Antal artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science- Metrix tidskriftklassifikation. Domän Fält N Villkorsstatus i SHERPA/RoMEO can cannot restricted unclear/ unknown Saknar ämneskategori 2335 1187 35 759 354 Allmän Allmän humaniora 20 16 . 4 . Allmän vetenskap 539 506 . 33 . Kulturvetenskap Estetiska vetenskaper 9 1 . 8 . Filosofi och teologi 77 45 3 29 . Historiska vetenskaper 208 104 5 93 6 Språk och kommunikationsvetenskap 70 18 1 50 1 Medicinska vetenskaper Beteendevetenskap 341 175 5 158 3 Biomedicinska vetenskaper 1790 977 57 728 28 Hälsovetenskap 1057 450 8 591 8 Klinisk medicin 5319 2443 198 2561 117 Naturvetenskap Biologiska vetenskaper 783 418 10 349 6 Fysik och astronomi 2149 1954 8 179 8 Geovetenskap 652 552 22 77 1 Kemivetenskap 869 417 . 447 5 Matematiska vetenskaper 307 257 4 42 4 Samhällsvetenskap Ekonomiska vetenskaper 513 309 2 201 1 Samhällsvetenskap 479 146 12 308 13 Tekniska vetenskaper Agrikulturella vetenskaper 506 287 8 185 26 Designvetenskaper 124 60 2 62 . Generiska teknologier 1156 804 31 272 49 Informations- och kommunikationsteknologi 424 360 1 49 14 Ingenjörsvetenskap 644 500 29 109 6 Totalt 20371 11986 441 7294 650 43 Tabell 17: Andel artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science-Metrix tidskriftklassifikation. Domän Fält N Villkorsstatus i SHERPA/RoMEO can cannot restricted unclear/ unknown Saknar ämneskategori 2335 51% 1% 33% 15% Allmän Allmän humaniora 20 80% 0% 20% 0% Allmän vetenskap 539 94% 0% 6% 0% Kulturvetenskap Estetiska vetenskaper 9 11% 0% 89% 0% Filosofi och teologi 77 58% 4% 38% 0% Historiska vetenskaper 208 50% 2% 45% 3% Språk och kommunikationsvetenskap 70 26% 1% 71% 1% Medicinska vetenskaper Beteendevetenskap 341 51% 1% 46% 1% Biomedicinska vetenskaper 1790 55% 3% 41% 2% Hälsovetenskap 1057 43% 1% 56% 1% Klinisk medicin 5319 46% 4% 48% 2% Naturvetenskap Biologiska vetenskaper 783 53% 1% 45% 1% Fysik och astronomi 2149 91% 0% 8% 0% Geovetenskap 652 85% 3% 12% 0% Kemivetenskap 869 48% 0% 51% 1% Matematiska vetenskaper 307 84% 1% 14% 1% Samhällsvetenskap Ekonomiska vetenskaper 513 60% 0% 39% 0% Samhällsvetenskap 479 30% 3% 64% 3% Tekniska vetenskaper Agrikulturella vetenskaper 506 57% 2% 37% 5% Designvetenskaper 124 48% 2% 50% 0% Generiska teknologier 1156 70% 3% 24% 4% Informations- och kommunikationsteknologi 424 85% 0% 12% 3% Ingenjörsvetenskap 644 78% 5% 17% 1% Totalt 20371 59% 2% 36% 3% 44 Figur 11: Antal och andel artiklar från 2011 redovisat per villkorsstatus i SHERPA/RoMEO samt per ämne i Science-Metrix tidskriftklassifikation. 1187 16 506 1 45 104 18 175 977 450 2443 418 1954 552 417 257 309 146 287 60 804 360 500 35 0 0 0 3 5 1 5 57 8 198 10 8 22 0 4 2 12 8 2 31 1 29 759 4 33 8 29 93 50 158 728 591 2561 349 179 77 447 42 201 308 185 62 272 49 109 354 0 0 0 0 6 1 3 28 8 117 6 8 1 5 4 1 13 26 0 49 14 6 Saknar ämneskategori Allmän humaniora Allmän vetenskap Estetiska vetenskaper Filosofi och teologi Historiska vetenskaper Språk och kommunikationsvetenskap Beteendevetenskap Biomedicinska vetenskaper Hälsovetenskap Klinisk medicin Biologiska vetenskaper Fysik och astronomi Geovetenskap Kemivetenskap Matematiska vetenskaper Ekonomiska vetenskaper Samhällsvetenskap Agrikulturella vetenskaper Designvetenskaper Generiska teknologier Informations- och kommunikationsteknologi Ingenjörsvetenskap A l l m ä n K u l t u r v e t e n s k a p M e d i c i n s k a v e t e n s k a p e r N a t u r v e t e n s k a p S a m h ä l l s v e t e n s k a p T e k n i s k a v e t e n s k a p e r can cannot restricted unclear/unknown Studie Publiceringsår för studerade artiklar År när mätningen gjordes Index/källa för artiklar Artiklar i OA- tidskrifter Artiklar med fördröjd OA Hybrid OA- artiklar Övriga fritt tillgängliga artiklar Grön OA- artiklar i ämnesarkiv Grön OA- artiklar i institutionella arkiv Total OA globalt Björk et al 2009 2006 2007 Ulrich´s 4,6 3,5 3,0 3,3 5,0 19,4 Gargouri et al 2012 2006 2009 WoK 21,0 21,0 Björk et al 2010 2008 2009 Scopus 5,3 1,2 2,0 11,9 20,4 Gargouri et al 2012 2010 2011 WoK 1,2 21,9 23,1 Laakso & Björk 2012 2011 2012 Scopus 11,0 5,2 0,7 Archambault et al 2013 2011 2013 Scopus 11,5 32,5 44,0 Elsevier 2013 2012 (guld), 2011-2013 (grön, hybrid, fördröjd) 2013 Scopus 9,7 1,0 0,5 11,4 Studie (svensk OA) Publiceringsår för studerade artiklar År när mätningen gjordes Index/källa för artiklar Artiklar i OA- tidskrifter Artiklar med fördröjd OA Hybrid OA- artiklar Övriga fritt tillgängliga artiklar Grön OA- artiklar i ämnesarkiv Grön OA- artiklar i institutionella arkiv Total OA Sverige Hedlund 2010 2008 2009 Scopus 11,4 11,2 22,6 Archambault et al 2013 2008-2011 2013 Scopus 8,0 40,0 48,0 Föreliggande studie (maskinell) 2011 2013 SwePub 10,4 8,7 6,3 25,4 Föreliggande studie (manuell) 2011 2013 SwePub 11,0 9,7 24,7 6,8 52,2 Tabell 18: Översikt över senare års studier över andel OA. Siffrorna är procenttal av alla artiklar som ingår i det studerade indexet. Modifierad efter Björk et al (2014).