Digitala data åldras på ett sätt som papper inte gör. 1980- och 90-talets disketter går knappast att använda idag.

Forskningsdata som alla kan nå

2016-06-13

Forskare producerar årligen stora mängder intressanta data. Data som skulle kunna återanvändas – om det var känt att de existerade. Svensk nationell datatjänst, SND, driver nu ett pilotprojekt för att göra data mer tillgängliga.

I värsta fall hamnar forskningsdata i papperskorgen när en forskares rum städas ut efter att hen gått i pension. Eller så har data ett format som inte längre går att tyda eller kräver en teknik som inte längre existerar.

Idag finns inget formaliserat system för hur forskningsdata ska sparas och göras förståeligt.

– Lärosätena har arkivansvar, men ansvaret delegeras ofta till institutionerna och där lämnas det kanske lite informellt över från prefekten till forskaren och så hamnar data på en usb-sticka i en byrålåda, konstaterar Stefan Ekman.

Han är forskningssamordnare vid Svensk nationell datatjänst, SND, vid Göteborgs universitet som har i uppdrag att tillgängliggöra data inom humaniora, medicin och samhällsvetenskap. SND ansvarar sedan 2016 också för infrastrukturen Environment and Climate Data Sweden där miljö- och klimatdata görs tillgängliga och tanken är att öppna upp för alla ämnesområden framöver.

Användas för ny forskning

SND har en katalog över forskningsdata men den bygger på att forskare frivilligt lämnar bidrag. Och SND är för litet för att ta hand om Sveriges samlade forskningsdata.

Därför har nu pilotprojektet Bibliotek-Arkiv-SND 2016, BAS 16, startats med det långsiktiga syftet att bevara och göra data tillgängliga så att de kan användas för ny forskning.

– Tanken är att data som nyproduceras ska finnas tillgängliga för åtminstone andra svenska forskare som vill bygga vidare, verifiera studier eller använda dem för till exempel interdisciplinärt arbete. Mycket pekar på att det kommer krav på att data från offentligt finansierade forskningsprojekt ska göras tillgängliga i framtiden, säger Stefan Ekman.

Pilotprojektet pågår under 2016 vid Göteborgs universitet, Luleå tekniska universitet, Lunds universitet, Malmö högskola och Jönköping University. I höst tillkommer Stockholms universitet, Umeå universitet och Blekinge tekniska högskola.

Stödja forskare och lösa problem

Projektet handlar om att undersöka hur man kan bygga upp lokala enheter på lärosätena med personal som ska utbilda och stödja forskare i hur de kan hantera sina data. Dessutom ska projektet utveckla former för en nationell datakatalog och lösa problem som kan uppstå på grund av olika sorters teknik.

– Digitala data åldras på ett sätt som papper inte gör och vi vet ännu inte riktigt hur bevarandet ska fungera.

Stefan Ekman tar exemplet med 80-och 90-talets disketter som idag knappast går att använda. De kan ha förstörts rent fysiskt eller så finns varken diskettenheter eller programvara kvar. För att kunna garantera tillgänglighet i framtiden måste sådana problem förutses – idag.

Alla forskningsdata kommer aldrig att kunna göras tillgängliga villkorslöst, bland annat beroende på sekretess, patent och industrifinansiering. Men då bör det finnas en nationell enhet, menar Stefan Ekman, som kan hantera förfrågningar och hjälpa till med exempelvis sekretessprövningar.

Spelar en nyckelroll

Lärosätenas biblioteks- och arkivpersonal har en nyckelroll i projektet. En av dem är Eva M Johansson som är bibliotekarie på Ekonomiska biblioteket vid Handelshögskolan i Göteborg. Hon och en grupp kolleger har utbildats av personal från SND, för att i sin tur kunna utbilda intresserade forskare i hur de ska hantera sina data.

En viktig del i forskarnas läroprocess är att skriva en datahanteringsplan över sin studie, något som ett antal forskningsfinansiärer redan kräver. Planen är omfattande och innehåller alltifrån mappstruktur, filformat, säkerhet och juridiska frågor, till hur lagring, backup och långtidsbevarande ska fungera.

Men Eva M Johansson menar att det är väl värt att lägga ner tid på planen.

– Tanken är att planen ska underlätta i forskarvardagen och att det ska bli enklare att hantera sina data. Speciellt om man är ny som forskare.

Sista steget för forskaren är att överlämna data till dataarkivet genom att fylla i ett överlämningsformulär på webben som blir synligt och sökbart både nationellt och internationellt. Forskaren behöver inte tillgängliggöra allt utan bara vissa delar, om hen till exempel har tänkt bygga vidare på sin studie.

– Det är en stor vinst att data kan återanvändas, även för studenter på grundnivå och mastersstudenter. Det måste vara oerhört mycket bättre att som forskare komma åt grundmaterialet, säger Eva M Johansson.

Text: Helena Östlund
Foto: Depositphotos, Torbjörn Berglund, Helena Östlund