Vetenskapsrådets betygsskala vid bedömningar av ansökningar borde innehålla fler steg och vara centrerad kring en neutral kvalitetsnivå, menar Daniel Waldenström. Foto: Graphic Node /Unsplash

debatt

24 januari 2024

Vetenskapsrådet borde ändra sitt betygssystem

När forskare söker pengar hos Vetenskapsrådet betygssätts deras ansökningar enligt ett betygssystem som skapar osäkerhet och godtycke. Det finns dock några enkla förbättringar som skulle lösa de största problemen, skriver Daniel Waldenström vid Institutet för näringslivsforskning.

Daniel Waldenström, Institutet för näringslivsforskning

Daniel Waldenström

Att mäta och jämföra kvalitet i forskning är välkänt svårt. När fler söker medel än det finns pengar till behövs dock rutiner för att betygssätta och rangordna ansökningarna.

Vetenskapsrådet betygsätter kvaliteten enligt fyra baskriterier: ”Projektets vetenskapliga kvalitet”, ”Nytänkande och originalitet”, ”Sökandes kompetens”, ”Genomförbarhet”. Utifrån dessa betyg ska ett femte ”Sammanfattande betyg” sättas. Betygsskalan är sjugradig: 1=Dålig, 2=Svag, 3=Bra, 4=Mycket bra. 5=Mycket bra till utmärkt, 6=Utmärkt, 7=Enastående. Genomförbarheten bedöms dock enligt en tregradig betygsskala.

Men många bedömare tolkar ändå betygsskalan som vore den symmetrisk kring ett neutralt mittenbetyg

Tyvärr lider Vetenskapsrådets betygssystem av ett antal problem som påverkar finansieringsprocessen. Det har blivit uppenbart för mig när jag bedömt ansökningar i flera av Vetenskapsrådets utlysningar inom samhällskunskap och humaniora, både som ledamot och ordförande för olika beredningsgrupper.

Problem1: Betygsskalan är asymmetrisk med ett alltför positivt mittenbetyg

Den sjugradiga betygsskalan får återkommande kritik. Det kanske största problemet är att skalan inte är symmetrisk kring en centrerad, neutral kvalitetsnivå. Istället är skalan avsiktligt skevt fördelad där mittenbetyget är ”Mycket bra”. Syftet är att öka möjligheten till urskiljning inom toppgruppen.

Men många bedömare tolkar ändå betygsskalan som vore den symmetrisk kring ett neutralt mittenbetyg, vilket skapar obalans och risk för godtycke. För att illustrera problemet använder jag betygsdata från utlysningen ”Internationell postdok” inom samhällskunskap, utbildningsvetenskap och humaniora.

Figur 1 visar fördelningen av samtliga ansökningars sammanfattande totalbetyg som bedömarna har gjort vid sin första individuella betygssättning. Dessa betyg utgör grunden för sållningen, då cirka hälften av ansökningarna lyfts bort från vidare behandling. Data visar att det aritmetiska genomsnittet är 4,0, alltså precis på mittenbetyget i skalan, och att fördelningen är symmetrisk, nästan normalfördelad, kring mittenbetyget.

Figur 1: Fördelning av bedömarnas totalbetyg på samtliga ansökningar

Det finns givetvis skillnader mellan de olika bedömarnas betygssättning. Figur 2 visar de enskilda bedömarnas fördelning av de slutbetyg som deras ansökningar har fått. Figuren visar på en relativt stor spridning i betygsfördelning mellan bedömarna, trots att det finns ett överlapp eftersom varje ansökan bedöms av tre bedömare. Prickarna i botten visar bedömarnas respektive medelbetyg. I denna utlysning skiljer det hela två betygssteg mellan högsta och lägsta bedömarna.

Figur 2: Fördelning av bedömarnas totalbetyg, per bedömare

Att bedömare sätter olika betyg inget konstigt. Harmoniseringen vid bedömningsmötet är tänkt att hantera detta. Men om skillnaderna blir stora av skäl som inte beror på bedömarnas läggning eller ansökningarnas egenskaper utan på betygsskalans konstruktion uppstår problem.

Diskussionerna vid de möten jag har varit på antyder att spännvidden i hög grad förklaras av tolkningsskillnader av betygsskalan. Och vid den tidpunkten är skadan redan skedd. Det är nämligen så att sållningen som tar bort cirka hälften av ansökningarna från vidare behandling görs efter första betygssättningen, och före harmoniseringsmötet. Ansökningar som har råkat få ”lågbetygstolkare” löper större risk att sållas ut än om de hade bedömts av ”högbetygstolkare”.

Betygsskalorna som statliga forskningsfinansiärer i andra länder använder liknar Vetenskapsrådets, förutom på en punkt: deras mittenbetyg är neutralare.

Problem 2: Betygsskalan har för få steg

Ett annat problem är att Vetenskapsrådets betygssteg är för få. Detta verkar även myndigheten anse eftersom de föreslår att bedömargrupperna lägger till extra kvalitetsnivåer utöver de som anges i anvisningarna. Specifikt handlar det om att bedömarna ges möjlighet att addera en kvalitetsdimension i tre nivåer, svag-medel-stark, till totalbetyget.

Anledningen till att Vetenskapsrådet inför fler betygssteg är helt enkelt för att erfarenheten visar att betygsskalan har för få steg. Alltför många ansökningar hamnar på samma betyg i samtliga bedömningsdimensioner.

Förslag till lösning på problem 1 & 2: Symmetrisk betygsskala 1–10 eller 1–20

Mitt förslag är att Vetenskapsrådet inför en ny betygsskala skala som är symmetrisk 1–10 eller 1–20, där 1 är Mycket dåligt och 10 eller 20 är Extremt (ouppnåeligt) bra. Mittenbetygen motsvarar en neutralt godtagbar nivå.

Symmetriska skalor likt dessa används hela tiden och förstås av alla inom alla discipliner. Skalan 1–20 används i svensk grund-och gymnasieskola när bokstavsbetyg räknas om till sifferbetyg.

Problem 3: Både delbetyg och sammanfattande betyg skapar inkonsekvens

Varje ansökan får fyra delbetyg och ett femte totalbetyg som ska bygga på de fyra första. Här uppstår flera problem. Ett är att det inte finns någon tydlig vägledning om hur sammanvägning ska ske. I praktiken ska bedömarna sätta vikter på de olika delkriterierna, men dessa vikter kan skilja sig åt betydligt mellan olika bedömare.

Vid det avslutande bedömningsmötet uppmanar Vetenskapsrådet dessutom gruppen att skapa explicita vikter, eller åtminstone rangordna mellan delkriterierna. Detta för att kunna rangordna ansökningar som fått samma slutbetyg även efter att de tre extrabetygen tillämpats.

Det skapar osäkerhet och risk för godtycke. Risk för strategiskt beteende kan också uppstå.

Men inget av detta beskrivs tydligt i Vetenskapsrådets instruktioner till bedömarna. Det skapar osäkerhet och risk för godtycke. Risk för strategiskt beteende kan också uppstå. Min erfarenhet visar att erfarna bedömare har ett försteg eftersom de på förhand förstår den oproportionerligt stora betydelsen av totalbetyget, medan alla nya bedömare av naturliga skäl inte har uppnått denna förståelse.

Förslag till lösning: Gör om totalbetyget till ett vägt genomsnitt av delkriteriernas betyg

En relativt enkel lösning vore att det sammanvägda totalbetyget görs om till att vara en funktion av delkriteriernas betyg. Här måste tydliga vikter bestämmas på förhand, vilket Vetenskapsrådet borde göra eftersom kriterierna och deras innehåll ju redan är formulerade. Ett exempel vore att sätta vikterna 0,35 på både vetenskaplig kvalitet (“Kvalitet”) och nytänkande och originalitet (“Nytänkande”), 0,2 på den sökandens meriter (“Merit”) och 0,1 på “Genomförbarhet”, vilket ger följande beräkning av totalbetyget:

Totalbetyg = 0,35*Kvalitet + 0,35*Nytänkande + 0,2*Merit + 0,1*Genomförbarhet

Sammanfattningsvis har jag i denna text argumenterat för att en ny, symmetrisk betygsskala 1–10 eller 1–20 kring ett neutralt mittenvärde borde ersätta den betygsskala som Vetenskapsrådet använder idag. Totalbetyget bör sättas som ett vägt medelvärde av de olika delkriterierna och inte som idag vid sidan av delbetygen. Dessa förändringar skulle bidra till ökad tydlighet, konsekvens och stärkt rättssäkerhet i myndighetens finansieringsbeslut.

Daniel Waldenström, professor i nationalekonomi och docent i ekonomisk historia, Institutet för näringslivsforskning

Läs mer:

Vetenskapsrådets betygskriterier och betygsskalor på myndigetens webbplats Länk till annan webbplats.

Håller du med? Skriv en replik eller ett eget inlägg

Välkommen att skriva en replik eller ett annat inlägg om forskningens villkor! Mejla din text med kontaktuppgifter till: debatt@tidningencurie.se

Mer om vad som gäller för att skriva i Curie

Du kan också kommentera på LinkedIn Länk till annan webbplats., Facebook Länk till annan webbplats. och X. Länk till annan webbplats.

Finansiering

Läs hela debattråden

Replik: Den gemensamma diskussionen är minst lika viktig som betygen

7 februari 2024 | Vetenskapsrådet
Vetenskapsrådet borde ändra sitt betygssystem

24 januari 2024 | Daniel Waldenström, Institutet för näringslivsforskning

Du kanske också vill läsa

Debatt 6 mars 2024

Replik: Pengar till forskning ska fördelas utifrån kvalitet

Katarina Bjelke, Vetenskapsrådet

Vi vill att regeringen låter utreda om, och i så fall hur, fördelning av basanslaget kan öka forskningens kvalitet. Det skriver Vetenskapsrådets generaldirektör Katarina Bjelke i e...

Nyhet 5 mars 2024

De fick maxpoäng på sina EU-ansökningar

Anders Nilsson

Hur lyckas man med sin Marie Curie-ansökan? Det vet Gabriele Greco och Konstantin Nestmann som båda fick 100 av 100 poäng och nu är anställda som postdoktorer i Sverige.

Nyhet 28 februari 2024

Forskarnas råd för en framgångsrik ansökan

Keiko Snarberg

Att söka medel för forskning tar tid och kräver planering. Curie har bett tre erfarna forskare om tips på hur man skriver sin första ansökan för att öka chanserna att få den bevilj...