För att modellera algoritmerna krävs många olika typer av chiffer att utgå från. Därför kontaktade Beáta Megyesi prefekten för Vatikanens hemliga arkiv. Efter att ha gått igenom 20 000 sidor med brev i arkivet fick hon ut flera hundra chiffer.

Tillsammans knäcker forskarna historisk kod

2019-09-04

I projektet Decrypt samarbetar historiker, lingvister, datavetare och kryptologer för att kunna lösa chiffren i hemligt kodade historiska dokument.
– Att använda olika kompetenser och därmed kunna lägga alla pusselbitar på plats är minst lika häftigt som att knäcka en kod, säger forskningsledaren Beáta Megyesi.

Beáta Megyesi Foto: Mikael Wallerstedt

Beáta Megyesi är lektor vid institutionen för lingvistik och filologi vid Uppsala universitet och egentligen var det slumpen som fick in henne på kryptologi. Hon deltog i ett projekt som knäckte en chiffrerad bok från 1700-talet. Brevet var från en hemlig organisation, Oculisterna, som spionerade på frimurarorden. Händelsen blev en världsnyhet.

– I samband med upptäckten fick jag väldigt många mejl från privatpersoner och historiker med önskan om att vi skulle hjälpa dem med olika chiffer. Jag insåg då att vi saknar forskning, metoder och tvärvetenskaplig kompetens inom området, säger Beáta Megyesi.

Samordna olika forskningsgrenar

Målet med Decrypt är att bygga upp ny forskningskompetens inom historisk kryptologi. Det innebär bland annat att samla chiffer och nycklar och ta fram algoritmer som automatiskt kan knäcka kodade dokument, där det inte längre finns någon kodnyckel.

En av utmaningarna med projektet är att samordna de olika forskningsgrenarna så att samarbetet fungerar så effektivt som möjligt. Beáta Megyesi berättar att hon har lagt ner mycket tid på kommunikation inom och utom projektet för att förstå de olika grenarnas behov, forskningsfrågor, metoder och arbetssätt.

– För en datavetare är det självklart att sampublicera nya rön och att göra allt tillgängligt digitalt. Historiker publicerar mer själva och tänker ofta i termer av böcker. Men hittills har samarbetet fungerat utmärkt. Mycket beroende på att vi är öppna med alla våra diskussioner och generösa med att bjuda in andra. Ett mål med projektet är att involvera studenter och unga forskare, säger hon.

Vatikanens hemliga arkiv

Konkret går forskningen till så att man samlar in en stor mängd krypterade brev och autentiska nycklar från hela Europa via en webbplats. Det är lättare sagt än gjort eftersom de är svåra att hitta. Många nycklar har förstörts av säkerhetsskäl eller förvaras på olika platser utan någon koppling till de kodade breven och utan att de är indexerade.

En annan stötesten i projektet är att få in tillräckligt många olika typer av chiffer så att kryptologer och datalingvister har något att utgå från när de ska modellera sina algoritmer. En dörröppnare blev när Beáta Megyesi fick tillgång till Vatikanens hemliga arkiv.

– Jag skrev till prefekten för hemliga arkivet och förklarade att jag är intresserad av att samla chiffer och bygga en infrastruktur som kan användas för historisk kryptologi. Jag fick svar nästan direkt att jag var välkommen till Rom.

Hon fick tillgång till indexböcker med korta beskrivningar av arkivets innehåll. Efter att ha gått igenom 20 000 sidor med brev under två veckor fick Beáta Megyesi ut flera hundra chiffer. Det äldsta var från 1300-talet.

Latin, italienska och spanska i samma text

Nästa steg var att läsa in manuskripten digitalt med hjälp av bildanalys för att ta fram en text som kan läsas av datorn. Det gäller att få fram hur människor skrev under olika tidsperioder i ett visst språk och att skapa språkmodeller utifrån det.

– Och när vi väl vet vem som står bakom koden måste en historiker eller idéhistoriker sätta in det i en kontext, säger Beáta Megyesi och fortsätter:

– Bland det svåraste är att veta vilket språk manuskriptet är skrivet på eftersom man ofta chiffrerade hela meddelandet. Har vi tur finns det textsegment, men ofta är de på olika språk. I breven från hemliga arkivet hittar vi till exempel latin, italienska och spanska i samma text. Interpunktion används väldigt sällan, men däremot många förkortningar för att spara på papperet

Innehållet i de hemliga breven från Vatikanen handlar om att informera påven om olika saker, till exempel vardagliga händelser, enskilda individers familjeförhållanden och vem som festar med vem.

Verktyg som automatiskt kan dechiffrera

Bland det mest spännande som har framkommit hittills är ett brev från 1600-talet som avslöjar dåtidens medicinska kompetens, det så kallade Borgchiffret. Beáta Megyesi fick ta hjälp av en idéhistoriker som kunde berätta att det fanns ett 20-tal läkare under utbildning i Bologna vid den här tiden och att boken samlade 1600-talets farmaceutiska kunskap.

– Då föll pusselbitarna på plats. I övrigt kan man känna sig tacksam över att man inte behövde utsättas för den tidens behandlingar, förutom ett glas vin av hög kvalitet som ofta var obligatoriskt, säger hon med ett skratt.

Forskningsprojektet håller på att utveckla ett interaktivt verktyg som automatiskt kan dechiffrera en mängd olika typer av chiffer. Målet är att det ska kunna användas fritt av historiker, men även av andra  med intresse för kryptologi.

– Sedan finns det inte en algoritm som klarar allt, utan den måste hela tiden utvecklas och förfinas för de olika stegen. Vi tar hela tiden hjälp av historiker, men också av chiffernördar. Om det är något som inte vi kan knäcka lägger vi ut det på kryptotävlingen Mystery Twister och hoppas att någon annan klarar det!

Text: Carina Järvenhag
Foto: Musei Capitolini

Ta del av information om behandlingen av dina personuppgifter