Prenumerera på Curies nyhetsbrev

Nyheter, krönikor och debatter om forskarens vardag och aktuella forskningsfrågor. Varje vecka i din inkorg. Ges ut av Vetenskapsrådet.

Logotyp Curie - samtal om forskningens villkor
en människa i gången i ett arkiv

För att modellera algoritmerna krävs många olika typer av chiffer att utgå från. Därför kontaktade Beáta Megyesi prefekten för Vatikanens hemliga arkiv. Efter att ha gått igenom 20 000 sidor med brev i arkivet fick hon ut flera hundra chiffer. Foto: Musei Capitolini

NYHET

Tillsammans knäcker forskarna historisk kod

I projektet Decrypt samarbetar historiker, lingvister, datavetare och kryptologer för att kunna lösa chiffren i hemligt kodade historiska dokument.
– Att använda olika kompetenser och därmed kunna lägga alla pusselbitar på plats är minst lika häftigt som att knäcka en kod, säger forskningsledaren Beáta Megyesi.

Porträttbild Beáta Megyesi.

Beáta Megyesi. Foto: Mikael Wallerstedt.

Beáta Megyesi är lektor vid institutionen för lingvistik och filologi vid Uppsala universitet och egentligen var det slumpen som fick in henne på kryptologi. Hon deltog i ett projekt som knäckte en chiffrerad bok från 1700-talet. Brevet var från en hemlig organisation, Oculisterna, som spionerade på frimurarorden. Händelsen blev en världsnyhet.

– I samband med upptäckten fick jag väldigt många mejl från privatpersoner och historiker med önskan om att vi skulle hjälpa dem med olika chiffer. Jag insåg då att vi saknar forskning, metoder och tvärvetenskaplig kompetens inom området, säger Beáta Megyesi.

Samordna olika forskningsgrenar

Målet med Decrypt är att bygga upp ny forskningskompetens inom historisk kryptologi. Det innebär bland annat att samla chiffer och nycklar och ta fram algoritmer som automatiskt kan knäcka kodade dokument, där det inte längre finns någon kodnyckel.

En av utmaningarna med projektet är att samordna de olika forskningsgrenarna så att samarbetet fungerar så effektivt som möjligt. Beáta Megyesi berättar att hon har lagt ner mycket tid på kommunikation inom och utom projektet för att förstå de olika grenarnas behov, forskningsfrågor, metoder och arbetssätt.

– För en datavetare är det självklart att sampublicera nya rön och att göra allt tillgängligt digitalt. Historiker publicerar mer själva och tänker ofta i termer av böcker. Men hittills har samarbetet fungerat utmärkt. Mycket beroende på att vi är öppna med alla våra diskussioner och generösa med att bjuda in andra. Ett mål med projektet är att involvera studenter och unga forskare, säger hon.

Vatikanens hemliga arkiv

Konkret går forskningen till så att man samlar in en stor mängd krypterade brev och autentiska nycklar från hela Europa via en webbplats. Det är lättare sagt än gjort eftersom de är svåra att hitta. Många nycklar har förstörts av säkerhetsskäl eller förvaras på olika platser utan någon koppling till de kodade breven och utan att de är indexerade.

En annan stötesten i projektet är att få in tillräckligt många olika typer av chiffer så att kryptologer och datalingvister har något att utgå från när de ska modellera sina algoritmer. En dörröppnare blev när Beáta Megyesi fick tillgång till Vatikanens hemliga arkiv.

– Jag skrev till prefekten för hemliga arkivet och förklarade att jag är intresserad av att samla chiffer och bygga en infrastruktur som kan användas för historisk kryptologi. Jag fick svar nästan direkt att jag var välkommen till Rom.

Hon fick tillgång till indexböcker med korta beskrivningar av arkivets innehåll. Efter att ha gått igenom 20 000 sidor med brev under två veckor fick Beáta Megyesi ut flera hundra chiffer. Det äldsta var från 1300-talet.

Latin, italienska och spanska i samma text

Nästa steg var att läsa in manuskripten digitalt med hjälp av bildanalys för att ta fram en text som kan läsas av datorn. Det gäller att få fram hur människor skrev under olika tidsperioder i ett visst språk och att skapa språkmodeller utifrån det.

– Och när vi väl vet vem som står bakom koden måste en historiker eller idéhistoriker sätta in det i en kontext, säger Beáta Megyesi och fortsätter:

– Bland det svåraste är att veta vilket språk manuskriptet är skrivet på eftersom man ofta chiffrerade hela meddelandet. Har vi tur finns det textsegment, men ofta är de på olika språk. I breven från hemliga arkivet hittar vi till exempel latin, italienska och spanska i samma text. Interpunktion används väldigt sällan, men däremot många förkortningar för att spara på papperet.

Innehållet i de hemliga breven från Vatikanen handlar om att informera påven om olika saker, till exempel vardagliga händelser, enskilda individers familjeförhållanden och vem som festar med vem.

Verktyg som automatiskt kan dechiffrera

Bland det mest spännande som har framkommit hittills är ett brev från 1600-talet som avslöjar dåtidens medicinska kompetens, det så kallade Borgchiffret. Beáta Megyesi fick ta hjälp av en idéhistoriker som kunde berätta att det fanns ett 20-tal läkare under utbildning i Bologna vid den här tiden och att boken samlade 1600-talets farmaceutiska kunskap.

– Då föll pusselbitarna på plats. I övrigt kan man känna sig tacksam över att man inte behövde utsättas för den tidens behandlingar, förutom ett glas vin av hög kvalitet som ofta var obligatoriskt, säger hon med ett skratt.

Forskningsprojektet håller på att utveckla ett interaktivt verktyg som automatiskt kan dechiffrera en mängd olika typer av chiffer. Målet är att det ska kunna användas fritt av historiker, men även av andra med intresse för kryptologi.

– Sedan finns det inte en algoritm som klarar allt, utan den måste hela tiden utvecklas och förfinas för de olika stegen. Vi tar hela tiden hjälp av historiker, men också av chiffernördar. Om det är något som inte vi kan knäcka lägger vi ut det på kryptotävlingen Mystery Twister och hoppas att någon annan klarar det!

Decrypt ska göra det möjligt att läsa kodade historiska dokument

Det tvärvetenskapliga forskningsprojektet Decrypt (Decryption of historical manuscripts) syftar till att bygga upp ett nytt tvärvetenskapligt forskningsämne i historisk kryptologi.

I forskningsprojektet ingår forskare från sex olika discipliner: datorlingvistik, kryptologi, bildbehandling, datavetenskap, historia och lingvistik. Totalt deltar ett tiotal forskare från fyra olika länder. Ett nätverk har skapats med över 100 forskare från 25 länder.

Projektet finansieras av Vetenskapsrådet med 29,5 miljoner kronor i sju år.

Den första internationella konferensen i historisk kryptologi arrangerades i Uppsala i maj 2018. År 2020 samlas forskarna i Budapest.

Forskningsprojekt: Decryption of historical manuscripts (Uppsala universitets webbplats), (English) Länk till annan webbplats.

Du kanske också vill läsa

Debatt 2 september 2024

Rachel Irwin, Lunds universitet

Trots att riskerna med fältarbete är välkända diskuteras de sällan i forskarutbildningen. Frågor kring risk och säkerhet bör behandlas i doktorandkurser om metoder eller etik och u...

Nyhet 16 april 2024

Lisa Kirsebom

I den svenska sjukvården samlas mängder av data in som kan bli en enorm tillgång för forskare. Men otydliga lagar och tekniska utmaningar bromsar användandet. Nu växer arbetssätt o...

Nyhet 16 april 2024

Lisa Kirsebom

Hälsodata har blivit en allt viktigare tillgång för forskningen. De kan hjälpa oss att få svar på frågor om alltifrån samhällsreformer till medicinska behandlingar. Men enkel tillg...