Geologisk kartläggning av Atlasbergen i Marocko med hjälp av satellitdata. De gula och oranga områdena är kalksten respektive sandsten. De mörkt blå och gröna fälten är underliggande granitklippor.
Tema Forskningsdata:

Fler citeringar med återbruk av data

2012-08-20

Fler citeringar, större genomslag, bättre nätverk. Forskningssekreterare Magnus Friberg på Vetenskapsrådet ser stora vinster för forskare som gör sina data tillgängliga för alla.

En datapubliceringsplan är från och med i år obligatorisk för att Vetenskapsrådet ska bevilja ansökningar med stora faktainsamlingar. Planen ska tala om hur uppgifterna kommer att samlas in, struktureras och förvaras samt göras tillgängliga för andra användare.

– För många forskningsprojekt är det en jättestor investering att samla in data. De måste kunna bevaras över lång tid, säger forskningssekreterare Magnus Friberg på Vetenskapsrådet.

Universitetens ansvar

Som ansvarig för hanteringen av forskningsdata fick Magnus Friberg inför Vetenskapsrådets stora utlysning 2012 besvara åtskilliga frågor om det nya kravet på en datapubliceringsplan. Många forskare var oroliga för att tvingas tillämpa internationella standarder eller tekniska lösningar som de inte behärskar.

Magnus Friberg har lugnat dem med att universiteten är ålagda att bygga upp pålitliga system. Universiteten har också bibliotekarier som vet hur materialet bäst ska lagras för att bli tillgängligt för andra.

– Återanvändning av forskningsdata är nödvändigt för att kunna bygga vidare och åter analysera det som gjorts tidigare. Mycket information ligger och skräpar på datorer och usb-minnen. Om den försvinner när forskaren slutar eller går i pension är investeringen borta, konstaterar han.

– Många forskare tycker säkert att de har gjort sitt yttersta när de har samlat sina uppgifter i excel-dokument. Men det kommer nya versioner, nya format, nya programvaror. Just därför behöver tillgängligheten säkras i nationella eller internationella organisationer för datasamordning.

Nationell samordning

Svensk Nationell Datatjänst, SND, vid Göteborgs universitet har via Vetenskapsrådet fått uppdraget att samordna hela landets forskningsdatabaser inom samhällsvetenskap, humaniora och medicin. SND ska också underlätta och utveckla tillgången till data inom och utom landet samt erbjuda stöd under hela forskningsprocessen.

En nationell workshop om hanteringen av forskningsdata genomfördes i april 2012 vid Luleå tekniska universitet. Den mynnade ut i en samsyn om behovet av att skapa riktlinjer för samtliga lärosäten och andra datagenererande organisationer samt en gemensam infrastruktur med internationellt etablerade standarder och metadata (detaljerade beskrivningar av datainsamlingen).

Departemenssekreterare Eva Stensköld säger att utbildningsdepartementet är positivt till återpublicering av forskningsdata, men hur det genomförs är upp till de enskilda myndigheterna.

– Inom naturvetenskap jobbar man ofta i större forskargrupper och har en etablerad kultur för hur det ska ske. Inom humaniora och samhällsvetenskap är den ensamme forskaren vanligare, och man saknar fortfarande inom en del ämnesområden goda förebilder för samarbete. Men landskapet för open access håller på att förändras, och idag är det lättare för en enskild forskare oavsett område som vill publicera sina data, säger Eva Stensköld.

Konkurrensfördel

Open access har slagit igenom som ett begrepp för fri nätpublicering av vetenskapliga artiklar. Termen används ibland också i samband med nätpublicering av data. Magnus Friberg talar hellre om återanvändning.

Särskilt yngre forskare har upptäckt att de får fler citeringar och blir kända i vidare kretsar om de delar med sig av sitt bakgrundsmaterial.

– Det innebär en konkurrensfördel att publicera forskningsdata. Den som delar med sig får bättre nätverk. Vill man ha tillgång till ett brett samarbete måste man vara beredd på att dela information med andra. Men det måste skötas på rätt sätt, säger Magnus Friberg.

Metadata gör det möjligt för andra att förstå uppgifterna, och den som återanvänder data måste uppge källan. Det ska vara tydligt vem som har gjort vad.

Den gamla stammen av forskare tycker kanske att de har äganderätten till uppgifter som de har samlat in. De är oroliga för att någon ska stjäla deras resultat.

– Ingen vill samarbeta med den som använder andras uppgifter utan att uppge källan, säger Magnus Friberg.

Den som granskar ett vetenskapligt arbete, en så kallad peer reviewer, behöver tillgång till bakomliggande data för att kunna bedöma resultatets kvalitet.

– Jag tycker att data ska finnas tillgängliga när man skickar in sitt arbete, säger Magnus Friberg.

Offentliga handlingar

En lag om vidareutnyttjande av handlingar från offentlig förvaltning, som trädde i kraft för två år sedan, anpassar svensk lagstiftning till EU-direktivet Public Sector Information, PSI.

Publiceringen av forskningsdata har också stöd i tryckfrihetsförordningen, som är en grundlag. Alla handlingar vid universitet och andra myndigheter kan offentliggöras om de inte är belagda med sekretess.

Även enkätsvar och forskarens egna anteckningar räknas som allmänna handlingar. Om någon begär ut uppgifterna kan forskaren inte säga nej.

– Det finns ingenting som heter ”mina data”. Det är det egna universitetet som äger uppgifterna, hävdar Magnus Friberg.

Forskaren är skyldig att spara data av hög kvalitet. Misslyckade mätningar och ”mellandata” får rensas bort, men allt av värde ska arkiveras.

I princip bör handlingarna vara tillgängliga så fort de har skapats, men de kan också låsas en tid och släppas fria efter till exempel sex månader.

En vanlig lösning är att behålla forskningsdata där de har samlats in, till exempel i en gemensam dataportal för det egna universitetet. När de inte längre är aktuella förs de över till Riksarkivet.

Många ämnesområden har standardiserade metoder för faktainsamling.

– Men det får inte hindra kreativiteten. Ibland måste man gå ifrån standarden. Man måste kunna ha innovativa sätt att hämta in data, anser Magnus Friberg.

Text: Carin Mannberg-Zackari
Foto: NASA