Logotyp Curie - samtal om forskningens villkor
Hercules Dalianis fotograferad på en stor plan framför ingången till en stor byggnad

Hercules Dalianis har han bland annat forskat på automatisk textsammanfattning, lanserat en egen sökmotor samt utvecklat verktyg för att sammanfatta och avidentifiera patientjournaler. Foto: Carina Bergholm.

NYHET

AI-forskaren ger läkarna verktyg

Under sin långa karriär har Hercules Dalianis sett framtidens verktyg bli vardagsmat. Han är professor i data- och systemvetenskap och forskare inom klinisk textmining. Målet är att ge läkare, sjuksköterskor och medicinska forskare nya möjligheter.

Bakom den digitala revolutionen finns många forskare som vågat sig ut på okänd mark. En av dem är Hercules Dalianis som är specialiserad på naturlig språkbehandling − den del av artificiell intelligens, AI, som handlar om hur datorer bearbetar mänskligt språk. Hit hör till exempel rättstavningssystem och automatiska översättningssystem.

− Sådana verktyg var framtiden för 20-30 år sedan, men idag är de självklarheter, helt integrerade i sökmotorer, ordbehandlare, mobiltelefoner med mera, säger Hercules Dalianis som är professor vid institutionen för data- och systemvetenskap vid Stockholms universitet i Kista.

Själv har han bland annat forskat på automatisk textsammanfattning och lanserat en egen sökmotor. På senare år har han ägnat sig åt klinisk textmining, som handlar om att få fram användbara data ur stora mängder patientjournaltexter. Bland annat utvecklar han verktyg som gör det praktiskt och etiskt möjligt att använda data från patientjournaler till medicinsk forskning.

− Tidigare satt medicinska forskare och läste kanske 70 patientjournaler och försökte hitta samband. Med våra verktyg kan de analysera information från miljontals journaler som innehåller uppgifter om symtom, diagnoser, kroppsdelar, provsvar och läkemedel.

Andra projekt syftar till att förenkla och förbättra den kliniska verksamheten. Han utvecklar till exempel verktyg som gör det lättare för läkare att hitta rätt diagnoskoder, rapportera statistik till Socialstyrelsen och övervaka om patienter håller på att utveckla sepsis.

− Forskningen sker i samarbete med läkare och sjuksköterskor, främst vid Karolinska universitetssjukhuset, och känns väldigt meningsfullt.

Uppvuxen med läkare

Hercules Dalianis har haft läkare omkring sig hela livet. Hans föräldrar var från Grekland och båda var läkare. De arbetade i England när sonen föddes 1959, men flyttade snart till Kolmården i Östergötland och sedan vidare till stadsdelen Östermalm i Stockholm. Där växte han upp och där bor han fortfarande kvar, mitt emot KTH.

Som barn var han blyg. Han byggde med Lego och gillade att skruva och mecka.

− Pappa lagade trasiga grejer och visade mig hur man gjorde. Han hade egentligen velat bli ingenjör, men kom inte in på ingenjörsutbildningen i Aten på 1930-talet och fick bli läkare istället.

Som barn till två grekiska akademiker ska man bli ingenjör, advokat eller läkare.

I tonåren blev Hercules Dalianis mer utåtriktad. Han gick naturvetenskaplig linje på gymnasiet, var språkintresserad och läste franska och tyska. Senare skulle han också plugga spanska, ryska, kinesiska och arabiska. Man skulle kunna tro att språkintresset skulle få honom att välja en karriär inom humaniora?

− Som barn till två grekiska akademiker ska man bli ingenjör, advokat eller läkare. Min syster blev läkare, men jag tycker att det är läskigt med blod. Jag tänkte att ingenjör nog passade, eftersom jag var intresserad av astronomi.

Hercules Dalianis tog sig tvärs över gatan till KTH och läste till civilingenjör i elektroteknik. Han pluggade också en del astronomi och fick därför göra sitt examensarbete på Institutionen för plasmafysik vid KTH.

När han tog examen 1984 kändes det inte möjligt att fortsätta inom astronomi, bland annat på grund av att det inte fanns några doktorandtjänster. Istället varvade han långa resor till Asien och Sydamerika med språkstudier och extrajobb. Han arbetade som lärarvikarie på gymnasiet, som medicinteknisk ingenjör på Södersjukhuset och hjälpte till i sin mammas forskningsprojekt inom barnpsykiatrin.

Såg möjligheter inom data

Institutionen för data- och systemvetenskap, DSV, kom han i kontakt med 1986. Den hette då ADB-institutionen – som i Administrativ DataBehandling – och Hercules Dalianis började läsa en kurs i artificiell intelligens.

− Det lät spännande och till skillnad från astronomi var data en disciplin som växte, med många möjligheter.

När han började på doktorandutbildningen 1988 försörjde han sig på extraknäck inom industrin, bland som datakonsult på IBM och Capgemini.

− Projektet på IBM gick ut på att man skulle kunna skriva databasfrågor i naturligt språk till en databas och datamaskinen skulle kunna svara på frågorna med text. Det här var 1988-90 och ganska avancerat på den tiden, men sen la IBM ner projektet. Jag var också konsult på Ellemtel och på Ericsson, men även där lades projekten ned. En del av min doktorandtid levde jag på sparade pengar.

Att projekten lades ner kändes dock inte som nederlag.

− Nej, det får man räkna med och ofta används kunskaperna i något annat sammanhang senare. Jag hade kul under tiden, fick bra betalt och lärde mig mycket.

Fick nya idéer i Kalifornien

Andra erfarenheter samlade han på sig under studiebesök i Kalifornien, dit han fick stipendier vid flera tillfällen.

− Jag fick särskilt bra kontakt med professor Eduard Hovy vid Information Science Institute vid University of Southern California.

Efter åtta år var avhandlingen om automatisk textgenerering färdig och sedan väntade en postdoktortjänst i Eduard Hovys forskargrupp. Fru och barn följde med till Los Angeles och det blev ett bra år med ny inspiration och nya idéer.

− Internet hade börjat komma och plötsligt var ingen längre intresserad av automatisk textgenerering. Det fanns ju hur mycket text som helst på internet. Alla bytte till automatisk textsammanfattning, jag också.

När han kom hem gick han tillbaka till att arbeta på Capgemini, samtidigt som han sökte jobb inom akademin. Snart stod han med två jobberbjudanden.

− Jag blev erbjuden en fast tjänst som lektor vid Institutionen för data- och systemvetenskap i Kista och en postdoktortjänst vid Institutionen för numerisk analys och datalogi, NADA vid KTH. Jag blev jätteglad för båda erbjudandena och ordnade så att jag fick tjänstledigt från lektoratet och kunde ta postdoktortjänsten på KTH. Det innebar fyra års nästan ren forskningstid och nära till jobbet. Mina döttrar var små och det var praktiskt att snabbt kunna kila mellan hem, dagis och jobb.

På KTH byggde han upp den första svenska textsammanfattaren, Swesum, som sammanfattade nyhetstexter. Studenter gjorde sedan varianter för andra språk.

− Swesum gav riktigt bra sammanfattningar. Jag märkte att verktyget användes eftersom jag fick mejl från olika håll i världen när servrarna låg nere.

Gick över till sökmotorer

Runt år 2000 var sökmotorer nytt och hett och han blev nyfiken.

− Jag startade ett företag med doktoranden Johan Carlberger och vi tänkte bli rika. Tillsammans med några andra från KTH byggde vi en egen sökmotor, Siteseeker, som var anpassad för webbplatser och intranät samt för svenska språket. Webbansvarig fick sökstatistik och klickstatistik och kunde hjälpa användarna att hitta rätt.

Ibland var det tydligt att utvecklare på olika ställen i världen jobbade parallellt med samma idéer. Vid ett tillfälle testade Johan Carlberger att kombinera sökmotorn med ett rättstavningsprogram.

− Det var jättecoolt! När Johan stavade fel i sökmotorn föreslog rättstavningsprogrammet det rätta sökordet! Några månader senare kom den funktionen i Google.

Detsamma hände när Hercules Dalianis fick ingivelsen att kombinera en sökmotor med en textsammanfattare, för att slippa klicka på alla länkar för att kunna avgöra om de var intressanta.

− Även den tekniken kom snart i Google.

Landstinget bad om hjälp

När bolaget blev uppköpt 2012 var han anställd vid DSV, Institutionen för data- och systemvetenskap, och i gång med nya projekt. Några år tidigare hade Stockholms läns landsting hört av sig med en intressant förfrågan. De ville ha hjälp att sammanfatta patientjournaler.

− Det lät väldigt spännande. Efter att ha sökt etiktillstånd begärde jag ut alla patientjournaler från Karolinska universitetssjukhuset och fick två miljoner journaler. Namn och personnummer var borttagna, men alla annan information fanns med. Senare blev det betydligt svårare att få ut patientjournaler, men jag var tidigt ute. Det har gjort att jag har kunnat komma långt i min forskning på klinisk textmining.

Hans forskargrupp har bland annat tagit fram verktyg för att identifiera tecken på vårdrelaterade infektioner och biverkningar av läkemedel i patientjournalerna.

Med tiden har det uppstått ett behov av att kunna avidentifiera journalerna ytterligare. Även om patienternas namn och personnummer är borttagna kan det finnas information i den löpande texten som kan kopplas till en viss individ.

− Läkaren kan till exempel ha skrivit telefonnumret till patientens fru där. Det här är inget problem så länge det bara är min grupp som hanterar materialet. Vi har skrivit på sekretessavtal och jobbar off-line i ett låst serverrum på DSV, men för att kunna låta fler forska på materialet måste det finnas sätt att avidentifiera det helt och hållet.

Ett av de projekt som pågår nu handlar därför om att utveckla verktyg för avidentifiering. Här finns många utmaningar, till exempel att en del sjukdomar har namn efter läkare, som Parkinsons och Sjögrens syndrom. Personnamnet Inga ställer också till det.

− Om det i journalen står: ”Inga tecken på pneumoni” får inte programmet uppfatta ”Inga” som ett namn och ta bort det. Då får ju texten motsatt betydelse.

Chatbotten har långt kvar

Den senaste snackisen inom artificiell intelligens är förstås konversationsroboten Chat GPT som kan föra skriftliga samtal med användaren. Att bygga en sådan robot skulle inte vara möjligt på DSV.

− Den kräver enormt mycket större datakrafter än vi har, men jag har förstås provat att leka med den.

Vad tror han då – kommer Chat GPT att göra vissa yrkeskategorier överflödiga?

− Nja, den är ju fortfarande ganska dum och ger många felaktiga svar, bland annat gav den mig referenser till artiklar som aldrig existerat. Men om kanske 20 år – efter mycket utveckling – kommer den att göra stor nytta.

Läs också i Curie: Stort sug efter riktlinjer för ChatGPT (Curie)

Artikelserie: Vägen till akademin

Varför blev de forskare? Hur såg vägen dit ut? Vilka forskningsfrågor brinner de för?
Möt forskare från olika delar av forskarvärlden och läs om deras erfarenheter av akademin, i serien Vägen till akademin.

Läs alla artiklar i Curies serie Vägen till akademin

Du kanske också vill läsa

Nyhet 9 april 2024

Ulrika Ernström

Han kämpar för världens förbisedda svampar. Mykologen Henrik Nilsson undviker medvetet högrankade tidskrifter, men är en av världens mest citerade forskare. Och han har ett tydligt...

Krönika 2 april 2024

Forskande läkare kan bidra till nya lösningar och frågeställningar. Men andelen läkare som disputerar minskar. Johan Frostegård vill att det ska bli lättare att kombinera de båda r...

Nyhet 18 mars 2024

Charlie Olofsson

Som litet land är det svårt att konkurrera internationellt inom AI. De som driver på utvecklingen i Sverige ser ändå nischer där vi kan bli världsledande. − Jag tror att vi ska ha...