Nyckeln till framtidens smarta informationshantering

En stor mängd av den information som företag, myndigheter eller konsumenter behöver komma åt ligger i dag utspridd på nätet hos olika aktörer. Av olika skäl är det inte alltid möjligt att slå samman olika datakällor till en enda databas. En lösning är att integrera informationen virtuellt genom nya smarta metoder.

Olaf Hartig

Docent i datavetenskap

Wallenberg Academy Fellow 2023

Lärosäte:
Linköpings universitet

Forskningsområde:
Hanteringen av data och databaser med fokus på data på webben och på grafdata, samt på problem kopplade till fördelningen av data över flera, autonoma och/eller heterogena källor. 

Olaf Hartig är forskare vid Linköpings universitet och Wallenberg Academy Fellow. Hartig och hans forskargrupp har en vision om att man ska kunna samla information som i dag ligger utspridd på webben, eller på intranätet inom en organisation. Men det ska inte ske fysiskt, utan snarare virtuellt, så att varje aktör behåller kontrollen över sin egen information.

Informationen ligger i dag ofta i så kallade kunskapsgrafer. Det är en relativt ny, men redan etablerad teknik för att representera och analysera information.

Kunskapsgrafer är som stora, digitala kartor över hur olika saker i vår värld hänger ihop. De visar hur personer, platser och begrepp är kopplade till varandra genom olika relationer, ungefär som förgreningar i ett nätverk. Genom att koppla samman data från olika källor kan kunskapsgrafer avslöja nya samband och ge bättre förståelse för komplex information.

Kunskapsgrafer används brett, i allt från streamingtjänster och e-handelsbolag till stora industriföretag och forskning inom biomedicin.

– När en streamingtjänst föreslår en ny film eller serie baserat på vad användaren brukar gilla, så sker det ofta med hjälp av en kunskapsgraf. Det är alltså en teknik som en stor del av allmänheten kommer i kontakt med, förklarar Olaf Hartig.

Väva ihop utspridda data

Allt oftare ligger den information som används för analyser inte samlad på ett enda ställe, utan hos olika aktörer. Den kan också vara utspridd inom olika enheter på ett företag eller en myndighet. Olaf Hartig utvecklar nu metoder för hur man ska kunna väva ihop denna information.

– I detta sammanhang är det viktigt att betona att det inte alltid är möjligt att skapa en gigantisk sammansatt kunskapsgraf. I många fall kan det vara opraktiskt av tekniska eller organisatoriska skäl, och det kan även medföra juridiska problem.

Olaf Hartigs forskargrupp har därför fokus på att integrera graferna virtuellt, så att varje aktör behåller kontrollen över sina egna data.

Genom smarta metoder för så kallad ”federering” av kunskapsgrafer ska man kunna ställa frågor tvärs över många olika datakällor och ändå få ett integrerat svar ungefär som om all information var samlad i en och samma graf.

– För användaren ser det ut som en enda integrerad kunskapskälla, men under ytan fortsätter data att distribueras och kontrolleras av sina ursprungliga ägare.

Webben fascinerade tidigt

Intresset för den här forskningen började redan när Olaf Hartig var masterstudent i Berlin. Han blev fascinerad av hur webben höll på att utvecklas till en ny plattform med många dimensioner.

– Det var spännande att se, inte bara hur människor kom i kontakt med varandra via webben, utan även hur datorer via webben kan förstå och koppla samman data från en rad olika källor.

I sin forskarkarriär har han sedan följt en röd tråd om hur olika datakällor kan integreras. Utmaningarna med virtuell integration av data är många. Olika datakällor kan använda olika ord och termer för samma sak, och de tekniska gränssnitten skiljer sig ofta åt.

Kunskapsrepresentation och hantering av kunskapsbaser är en viktig del av AI och här ligger Sverige lite efter. Förhoppningsvis kan mitt projekt bidra till att stärka området, både inom akademin och industrin.

– Målet är att utveckla algoritmer och lösningar som tar hänsyn till dessa olika former av heterogenitet och som ändå är effektiva och skalbara.

I anslutning till detta mål utvecklar forskargruppen också så kallade benchmarktester för att utvärdera hur väl nya metoder presterar i olika scenarier.

Kan förbättra AI

Forskningen ligger nära dagens diskussion om artificiell intelligens. Ofta förknippas AI med maskininlärning och neurala nätverk, men kunskapsrepresentation och kunskapsgrafer är också en del av pusslet för att förbättra AI. Genom att para ihop avancerade språkmodeller, som ChatGPT, med kunskapsgrafer skulle man kunna minska problemen där systemet hittar på egna fakta. En kunskapsgraf kan fungera som ett kunskapsankare och göra AI-modellerna mer tillförlitliga.

– I framtiden kan kunskapsgrafer och stora språkmodeller samverka så att svaren blir mer korrekta och spårbara. Då kan man inte bara få ett svar, utan även en förklaring till varför det blev just det svaret, säger Olaf Hartig.

Anslaget Wallenberg Academy Fellow ger forskningen en rejäl skjuts framåt, både vad gäller ekonomiska medel och en ökad synlighet.

– Det här är ett forskningsområde som ännu inte är så uppmärksammat i Sverige som på andra håll, säger Olaf Hartig.

På längre sikt kan forskningen ge en nyckel till hur företag och myndigheter ska hantera sina data. Genom en virtuell integration av information blir det möjligt att förbättra samarbetet mellan olika verksamheter, fatta bättre beslut och skapa nya tjänster – utan att ge upp kontrollen över sina egna datakällor. Det är en framtidsvision som tillåter kunskap att flöda friare över gränserna i cybervärlden.

– Det kan så småningom hjälpa oss att dela och koppla samman mer pålitlig information och leda till nya genombrott inom olika vetenskapliga områden.

Text Nils Johan Tjärnlund
Bild Magnus Bergström