Miniprojekt

Kan syntetiske data give os en sikker adgang til data om borgere?

Kan syntetiske data være nøglen til sikker brug af persondata, og kan det udgøre datagrundlaget for at udvikle datadrevne modeller, som kan bruges til fx at forbedre sagsbehandlingen i kommuner?

Det spørgsmål har været udgangspunktet for et miniprojekt, som InfinIT har gennemført sammen med KMD, Københavns Universitet, DCR Solutions og Alexandra Instituttet –  en lille projektgruppe med forskellige perspektiver og erfaringer inden for arbejdet med data fra sagsbehandling, maskinlæring og anonymisering af data.

Der ligger en stor datamængde ude i kommunerne fra forskellige sagsforløb med borgere, og al den viden fra tidligere sager kan sandsynligvis bruges til at forbedre sagsforløbet til gavn for borgeren, eller man kunne lette arbejdsgangen for sagsbehandlerne, så de fik mere tid til at tale med borgeren.

Der er et potentiale i at anvende data til udvikling af datadrevne modeller eller beslutningsstøtteværktøjer, for eksempel via maskinlæring. Men udfordringen ligger i, at data indeholder personlige oplysninger – noget er måske endda personfølsomt – og samlet kan data også indeholde oplysninger om selve kommunen. Det er derfor med god grund, at det ikke er nemt at få adgang til.

At sikre borgerdata gennem anonymisering er ikke ligetil, for selvom man måske kunne garantere, at data er tilstrækkeligt anonymiseret med hensyn til det, man har for øje, så kan man ikke sikre sig imod, at der ikke senere kommer anden ekstra information, der kan bryde anonymiteten i datasættet.

Med syntetiske data kan man forsøge at generere noget data på baggrund af det originale data, således at det ’ligner’ det originale data så meget som muligt, men uden at ’rigtige’ individer eller sager kan spores i det nye datasæt. Derudover vil man forsøge at bevare så mange egenskaber ved data som muligt, så det ’ligner’ bedst muligt, samtidig med at man tilstræber en høj sikkerhed for privacy. Det ender imidlertid med at blive et trade off mellem de forskellige hensyn, for vi er stadig ikke der, hvor man kan få det hele.

Projektpartnerne arrangerede efter projektets afslutning et webinar, hvor de holdt oplæg med fokus på problematikken omkring at bruge data fra borgere i sagsbehandlinger, de potentielle gevinster, og hvorfor ideen om at kigge i retning af syntetiske data opstod. Du kan se hele webinaret her.

Vil du dykke ned i, hvordan de forskellige trade-offs kunne falde ud med syntetiske data, så læs dette blogindlæg af Amalie Brogaard Pauli fra Alexandra Instituttet, der har været med i miniprojektet. Her gennemgår hun fordele og ulemper ved forskellige metoder.

Laura Møller

Har du spørgsmål eller ønsker at vide mere om miniprojektet, er du velkommen til at kontakte Laura Møller.

Partnere

InfinIT miniprojektet er gennemført i samarbejde med KMD, Københavns Universitet, DCR Solutions og Alexandra Instituttet.

Formålet med miniprojektet har været at undersøge, om syntetiske data kan være nøglen til sikker brug af persondata, og om de kan udgøre datagrundlaget for at udvikle datadrevne modeller, som kan bruges til fx at forbedre sagsbehandlingen i kommuner.

 

Deltagerne i projektets afsluttende webinar fik viden om brug af syntetiske data, og hvad fremtidsperspektiverne er for både offentlige og private virksomheder.

Du kan streame webinaret her.

Kunstig intelligens og cybersikkerhed

InfinIT miniprojekt der afsluttede med et webinar

Med syntetiske data kan man generere data på baggrund af det originale data, så det ’ligner’ det originale data så meget som muligt, men uden at ’rigtige’ individer eller sager kan spores i det nye datasæt.

Derudover vil man forsøge at bevare så mange egenskaber ved data som muligt, så det ’ligner’ bedst muligt, samtidig med at man tiltræber en høj sikkerhed for privacy.

Det ender med at blive et trade off, for vi er stadig ikke der, hvor man kan få det hele.