Inom forskningen om klimatförändringar, cancerprevention och trafikflöden använder man sig av storskalig datahantering. Centret Serc har till uppgift att föra samman forskare som är skickliga på beräkning och datavetenskap med forskare som behöver processa sina data.
E-vetenskap

Flodvåg av data ger nytt kunskapsfält

2014-10-01

Idag hanterar många forskare – alltifrån sociologer till meteorologer – kopiösa datamängder. Det har lagt grunden för e-vetenskapen, ett helt nytt kunskapsfält. Nu kan vi studera data som vi förr studerade naturen, menar Erwin Laure, professor i datavetenskap vid KTH. Det här är den första av fyra artiklar i Curie om e-vetenskap.

Erwin Laure

Vad har astronomi, klimatvetenskap och genetik gemensamt?

Alla tre är forskningsfält som bygger på enorma mängder data. Nya mätmetoder och instrument gör det möjligt att studera fenomen på en detaljnivå som för hundra år sedan var omöjlig att föreställa sig. Resultatet blir en fullkomlig flodvåg av information.

För att den ska bli hanterbar krävs extremt kraftfulla datorer, avancerade beräkningsmetoder och statistisk analys. Med ett enda ord: e-vetenskap.

Erwin Laure är professor i datavetenskap vid KTH och chef för högskolans superdatorcentrum. Han kallar e-vetenskapen ett paradigmskifte, eller åtminstone ”ett kompletterande paradigm”.

Erwin Laure brukar beskriva naturvetenskapens utveckling i fyra steg. Först var den empirisk; den beskrev naturfenomen. För några hundra år sedan började den också bli teoretisk, modellbyggande. Sedan några årtionden finns dessutom en beräkningsbaserad del av vetenskapen där forskarna simulerar fenomen.

Ett redskap i sig själv

E-vetenskapen är det senaste steget. Visst används data fortfarande för att testa teorier, som vi har gjort i flera hundra år, men forskarna kan också börja i andra änden; utforska data förutsättningslöst och leta efter mönster.

– Vi går mot ett mer datacentrerat arbetssätt där data har förvandlats till en egen enhet, ett redskap i sig självt. Vi studerar data på samma sätt som vi för århundraden sedan studerade naturen, och bildar teorier utifrån det vi ser, säger Erwin Laure.

År 2010 utsågs e-vetenskap till ett av 20 strategiska forskningsområden i Sverige. Då bildades samarbetena Essence, mellan universiteten i Uppsala, Lund och Umeå, och Serc (Swedish e-Science Research Centre), mellan KTH, Karolinska institutet och universiteten i Stockholm och Linköping.

Erwin Laure är en av nyckelpersonerna i Serc. Centret arbetar med många vetenskapsfält i landet som bygger på storskalig datahantering. Uppgiften är att föra samman de forskare som är skickliga på beräkning och datavetenskap med dem som inte alls är intresserade av själva beräkningsarbetet men som behöver processa sina data. Inom nätverket finns forskningsprojekt om bland annat cancerprevention, klimatförändringar, trafikflöden och visualisering.

Team med helhetssyn

– Det är en utmaning att e-vetenskap är så interdisciplinärt. Man måste bygga team med en helhetssyn, där man sammanför datorresurser, matematiker, modellerare och de forskare som samlar in data och vet hur resultaten ska användas. Det tar tid att få sådana team effektiva, eftersom alla har olika vetenskapligt språk och bakgrund. Centra som Serc kan hjälpa till med det, säger Erwin Laure.

Ett begrepp som man hör betydligt oftare än e-vetenskap är ”big data”. Det brukar syfta på datamängder som är så stora att de kräver särskild teknik för allt från inhämtning till delning, analys och lagring.

Men alla teknikproblem har inte med stora datavolymer att göra. Säker lagring och anonymisering av data från mänskligt material är exempelvis viktigt oavsett hur stora informationsmängderna är.

En annan utmaning är att data åldras. Data curation kallas det att bearbeta och sköta data så att de ska fortsätta vara tillgängliga och begripliga även när tekniken förändras och när de forskare som samlade in dem inte finns kvar för att förklara.

Krävs utveckling

För att e-vetenskapen ska leva upp till sin fulla potential krävs en utveckling av både datorer och människor, menar Erwin Laure. Datorerna måste bli snabbare och mer effektiva, och forskarna mer flexibla.

– Studenter behöver utbildas interdisciplinärt, så att de forskare som kommer ut inte bara har kunskaper om sitt eget fält. Nu börjar det komma utbildningar med fokus på e-vetenskap, och det är bra.

Erwin Laure menar att vi i Sverige har varit ganska sena med att satsa på det här fältet, men nu tack vare Serc och Essence snabbt kommit ikapp andra länder.

– Med tanke på hur litet Sverige är har vi en bra datorinfrastruktur, och i dag skulle jag säga att vi är en av världens ledande nationer inom e-vetenskap.

Text: Lisa Kirsebom
Foto: Matton