Inom forskningen om klimatförändringar, cancerprevention och trafikflöden använder man sig av storskalig datahantering. Centret Serc har till uppgift att föra samman forskare som är skickliga på beräkning och datavetenskap med forskare som behöver processa sina data. Foto: Matton
NYHET
Flodvåg av data ger nytt kunskapsfält
Idag hanterar många forskare – alltifrån sociologer till meteorologer – kopiösa datamängder. Det har lagt grunden för e-vetenskapen, ett helt nytt kunskapsfält. Nu kan vi studera data som vi förr studerade naturen, menar Erwin Laure, professor i datavetenskap vid KTH. Det här är den första av fyra artiklar i Curie om e-vetenskap.
Vad har astronomi, klimatvetenskap och genetik gemensamt?
Alla tre är forskningsfält som bygger på enorma mängder data. Nya mätmetoder och instrument gör det möjligt att studera fenomen på en detaljnivå som för hundra år sedan var omöjlig att föreställa sig. Resultatet blir en fullkomlig flodvåg av information.
För att den ska bli hanterbar krävs extremt kraftfulla datorer, avancerade beräkningsmetoder och statistisk analys. Med ett enda ord: e-vetenskap.
Erwin Laure är professor i datavetenskap vid KTH och chef för högskolans superdatorcentrum. Han kallar e-vetenskapen ett paradigmskifte, eller åtminstone ”ett kompletterande paradigm”.
Erwin Laure brukar beskriva naturvetenskapens utveckling i fyra steg. Först var den empirisk; den beskrev naturfenomen. För några hundra år sedan började den också bli teoretisk, modellbyggande. Sedan några årtionden finns dessutom en beräkningsbaserad del av vetenskapen där forskarna simulerar fenomen.
Ett redskap i sig själv
E-vetenskapen är det senaste steget. Visst används data fortfarande för att testa teorier, som vi har gjort i flera hundra år, men forskarna kan också börja i andra änden; utforska data förutsättningslöst och leta efter mönster.
– Vi går mot ett mer datacentrerat arbetssätt där data har förvandlats till en egen enhet, ett redskap i sig självt. Vi studerar data på samma sätt som vi för århundraden sedan studerade naturen, och bildar teorier utifrån det vi ser, säger Erwin Laure.
År 2010 utsågs e-vetenskap till ett av 20 strategiska forskningsområden i Sverige. Då bildades samarbetena Essence, mellan universiteten i Uppsala, Lund och Umeå, och Serc (Swedish e-Science Research Centre), mellan KTH, Karolinska institutet och universiteten i Stockholm och Linköping.
Erwin Laure är en av nyckelpersonerna i Serc. Centret arbetar med många vetenskapsfält i landet som bygger på storskalig datahantering. Uppgiften är att föra samman de forskare som är skickliga på beräkning och datavetenskap med dem som inte alls är intresserade av själva beräkningsarbetet men som behöver processa sina data. Inom nätverket finns forskningsprojekt om bland annat cancerprevention, klimatförändringar, trafikflöden och visualisering.
Team med helhetssyn
– Det är en utmaning att e-vetenskap är så interdisciplinärt. Man måste bygga team med en helhetssyn, där man sammanför datorresurser, matematiker, modellerare och de forskare som samlar in data och vet hur resultaten ska användas. Det tar tid att få sådana team effektiva, eftersom alla har olika vetenskapligt språk och bakgrund. Centra som Serc kan hjälpa till med det, säger Erwin Laure.
Ett begrepp som man hör betydligt oftare än e-vetenskap är ”big data”. Det brukar syfta på datamängder som är så stora att de kräver särskild teknik för allt från inhämtning till delning, analys och lagring.
Men alla teknikproblem har inte med stora datavolymer att göra. Säker lagring och anonymisering av data från mänskligt material är exempelvis viktigt oavsett hur stora informationsmängderna är.
En annan utmaning är att data åldras. Data curation kallas det att bearbeta och sköta data så att de ska fortsätta vara tillgängliga och begripliga även när tekniken förändras och när de forskare som samlade in dem inte finns kvar för att förklara.
Krävs utveckling
För att e-vetenskapen ska leva upp till sin fulla potential krävs en utveckling av både datorer och människor, menar Erwin Laure. Datorerna måste bli snabbare och mer effektiva, och forskarna mer flexibla.
– Studenter behöver utbildas interdisciplinärt, så att de forskare som kommer ut inte bara har kunskaper om sitt eget fält. Nu börjar det komma utbildningar med fokus på e-vetenskap, och det är bra.
Erwin Laure menar att vi i Sverige har varit ganska sena med att satsa på det här fältet, men nu tack vare Serc och Essence snabbt kommit ikapp andra länder.
– Med tanke på hur litet Sverige är har vi en bra datorinfrastruktur, och i dag skulle jag säga att vi är en av världens ledande nationer inom e-vetenskap.
Swedish e-Science Research Centre Länk till annan webbplats, öppnas i nytt fönster.
Läs också i Curie:
Elxir förenar big data (Curie)
Forskare oroliga för biobanksregler (Curie)
Inte irrationellt att oroa sig för big data (Curie)
E-vetenskap
Vetenskap som nått en ny dimension genom att med hjälp av modern informationsteknik angripa problem av en omfattning och komplexitet som inte skulle kunna hanteras utan elektroniska hjälpmedel.
Vetenskapsrådet
Big Data
Digitalt lagrad information av storleken terabyte till petabyte, vilket kräver speciella metoder för att kunna hanteras. — Big data används inom många områden, exempelvis hälsovård, meteorologi, klimatanalys och handel. Det används också inom söktjänster som Google och Yahoo och webbtjänster som Facebook, YouTube, Twitter och Flickr
Nationalencyklopedin
Du kanske också vill läsa
Nyhet 17 september 2024
Miljöarkeologen Philip Buckland förstod tidigt att hans intresse för programmering och databasbyggande kunde vara till nytta inom akademin. Han ser att öppen data driver forskninge...
Nyhet 16 april 2024
I den svenska sjukvården samlas mängder av data in som kan bli en enorm tillgång för forskare. Men otydliga lagar och tekniska utmaningar bromsar användandet. Nu växer arbetssätt o...
Nyhet 16 april 2024
Hälsodata har blivit en allt viktigare tillgång för forskningen. De kan hjälpa oss att få svar på frågor om alltifrån samhällsreformer till medicinska behandlingar. Men enkel tillg...