Att även forskningsdata publiceras open access innebär att enormt mycket data behöver lagras och hållas tillgängliga över lång tid. Enligt det preliminära förslaget till nationella riktlinjer för detta ska lärosätena ta ansvar för att arkivera och bevara data som tas fram av deras forskare.

Publicera data med open access

2014-10-15

Även forskningsdata som ligger till grund för en publikation ska vara fritt tillgängliga för alla. Det föreslår Vetenskapsrådet i sitt utkast till nationella riktlinjer för open access. Enligt förslaget bör Sverige börja med pilotprojekt inom några utvalda områden.

EU kräver att resultat från forskning som får stöd från forskningsprogrammet Horisont 2020 ska publiceras öppet. Det gäller dock inte forskningsdata. Kraven att dessa ska publiceras öppet gäller ännu så länge bara några områden. I sitt utkast till nationella riktlinjer föreslår nu även Vetenskapsrådet att open access för data först ska prövas inom några områden. Vilka är ännu inte bestämt.

Det är bra att man skyndar långsamt, menar Mikael Borg. Han är teknisk koordinator för infrastrukturen BILS (Bioinformatics Infrastructure for Life Sciences), där man bland annat hjälper svenska forskare med bioinformatik och datahantering.

– Kunskaperna om hur man lagrar data brister fortfarande. Det är också stora kulturella skillnader mellan vetenskapsområden.

Han tycker det är positivt att open access ska omfatta även forskningsdata.

– Det kommer att vara en historisk parentes, denna tid när man hade tekniska möjligheter men ändå inte publicerade forskningsdata som stödjer de resultat man publicerar. Andra forskare kan verifiera resultaten. Det är viktigt för forskningens transparens. Dessutom kan data användas till nya studier och för att utveckla nya metoder.

Mycket att lagra lång tid

Open access för forskningsdata innebär att data ska finnas tillgängligt digitalt och fritt att återanvändas, men inom gällande lagstiftning. Det betyder att exempelvis data som innehåller personuppgifter kan skyddas av sekretesslagstiftningen.

De problem som öppenheten innebär är dock främst tekniska. Det är ofta väldigt stora datamängder som kommer att behöva lagras och hållas tillgängliga, över lång tid.

– Om du skannar av preparat av vävnad med en bildskanner får du ett antal gigabyte data. Har ett projekt hundra bilder ger det en terabyte data. Ska det göras tillgängligt innebär det kapacitetsproblem. Vi har inte byggt upp mekanismer för att hantera data. Data måste finnas tillgängliga lika länge som artikeln är intressant att läsa, säger Ewert Bengtsson som är professor i bildanalys vid Uppsala universitet.

Enligt det preliminära förslaget till nationella riktlinjer är det lärosätena som ska ta ansvar för att arkivera och bevara data som tas fram av deras forskare.

– Det är väldigt bra om vi får nationella riktlinjer och kan enas om hur vi ska göra. Alla behöver inte uppfinna hjulet. Det blir också lättare för universiteten att prioritera, säger Ewert Bengtsson.

Pilot i Uppsala

Han är själv ordförande i styrgruppen för ett pilotprojekt som drivs i Uppsala. Målet är att ta reda på hur universitetet ska kunna lagra data långsiktigt och säkert. En utredning har tagit fram ett förslag på en modell som skulle erbjuda alla forskare med normalstora datamängder fri långsiktig central lagring av dessa.

Man har utgått ifrån att de 5000 forskarna har i genomsnitt 100 gigabyte data, vilket ger totalt 500 terabyte att ta hand om. Fysiskt räcker det med några skåp i en serverhall för att lagra dessa. Innan man kör igång i full skala genomförs i år en pilotstudie på sex avdelningar runt om på universitetet.

– Förhoppningsvis ska piloten ge positiva erfarenheter så att vi 2015 kan upphandla och införa detta i full skala. På sikt kommer inte 100 gigabyte att räcka men kapacitetsökningen i lagringsmedia gör att vi hoppas att framtida uppgraderingar ska hålla jämna steg med behoven, säger Ewert Bengtsson.

Mikael Borg tycker att det bästa sättet att finansiera lagring är att koppla det till projektmedel, så att man inte producerar mer data än man har råd att lagra. Han efterlyser en morot för forskare att göra även data bakom resultaten tillgängliga.

– Det saknas incitament att publicera forskningsdata. Det måste vara meriterande att göra data tillgängliga när man söker medel. Citeringar räknas, men inte om man har publicerat data, säger han.

I det preliminära förslaget till nationella riktlinjer är en punkt just att forskare ska få erkännande när data används på samma sätt som när artiklar citeras. Det underlättas i och med att data får en permanent identifikationsmarkör

Läs mer om förslaget till nationella riktlinjer för open access:

Svenskt open access-förslag snart klart

Text: Siv Engelmark
Foto: Matton