Insight

Dataetik er en del af god ledelse

 

Etik er et vanskeligt håndterbart emne, som i høj grad handler om, hvordan værdier udleves og fortolkes i det daglige. Men med øget digitalisering og brug af data som beslutningsgrundlag må dataansvarlige såvel som ledere forholde sig til etik.

Alle organisationer sigter efter konkrete mål, og deres arbejde foregår inden for en specifik ramme såsom lovgivning, bestyrelsesmandat, resultatkontrakt eller lignende. I denne sammenhæng er etik, herunder dataetik, på vej ind som en central del af god ledelse.

I teknologisektoren hævdes det traditionelt, at teknologi i sig selv hverken er god eller ond, men at etikken er afgørende for den måde, teknologien bliver anvendt på. Dog har der været flere offentligt kendte eksempler på tendentiøse, diskriminerende og uetiske algoritmer, og derfor holder synspunktet om etisk neutralitet ikke fuldt ud længere. Teknologi kan naturligvis have uønskede effekter, hvis den med fuldt overlæg anvendes ’ondt’, ikke er udviklet tilstrækkeligt kløgtigt eller ikke har gennemgået en fyldestgørende etisk vurdering.

For at undgå dette skal virksomhedens ledelse sikre strenge udviklingskrav til god og etisk forsvarlig udvikling. Fra Deloitte ser vi en række opmærksomhedspunkter for at sikre god dataetik:

  • Fokuser på kvaliteten af datagrundlaget for modellen for at undgå bias (skævhed) og diskrimination i udvikling og oplæring af algoritmer.
  • Øg transparens og kommunikation om beslutninger og beslutningsgrundlag.
  • Sikre privatlivets fred, og at data kun anvendes til de formål, det er aftalt (og at brugeren har reel mulighed for at gennemskue anvendelsen).
  • Fastlæg ansvaret for handlinger, der er udløst af en AI-komponent / algoritme.
  • Er grundlaget for at bruge data i det konkrete tilfælde i orden, og er et samtykke givet på en måde, hvor det er klart, hvad data skal anvendes til og på hvilken måde?
     

Udvikling

For udviklingen af algoritmer betyder det, at der skal anvendes en udviklings- og oplæringsmetodik, som aktivt søger at undgå skævhed og bias i de regler, der implementeres som del af beslutningsprocesser, beslutningsstøtte eller til understøttelse af processer. Det kan eksempelvis være i form af review af modellen, en vurdering af forklarende variable, og hvorvidt der kan gøres rede for modellen.

Vurderingen af de primært forklarende variable kan blandt andet omfatte en gennemgang af, om variablene forekommer reelle, eller om der er risiko for bias. Dertil må man gøre sig det klart, om der er en naturlig og forståelig årsag til, at variablene optræder som væsentligt forklarende variable, eller om de reelt er et udtryk for andre, underliggende faktorer.

Når der fældes dom over modellen, er det vigtigt at vurdere, om den forekommer rimelig, er mulig at forklare, og om variablerne forekommer relevante og fordomsfri. Det er her en forudsætning, at dataene til modellen er indsamlet lovligt og med respekt for privatlivets fred.

Når et udviklingsprojekt planlægges, bør en vurdering af en algoritme er gangbar, har et robust datagrundlag, er upartisk og repræsenterer virkeligheden indgå i tilrettelæggelsen. Et ikke-robust datagrundlag har bias, således at der kan rejses kvalificeret tvivl om algoritmens neutralitet.

Der er en væsentlig risiko forbundet med at udvikle en algoritme, der ikke kan forklares eller som har et ikke-robust datagrundlag. Og projektledere må derfor løbende forsøge at fjerne denne risiko gennem hele udviklingsprocessen. Ellers risikerer man, at en løsning ikke løbende kan bringes i anvendelse eller skaleres uden eksempelvis store omkostninger til håndtering og rensning af data.

Samtidig er det væsentligt at sikre, at et par ’ekstra øjne’ validerer modellen og kaster et nyt blik på modellens resultater og forklarende variable. I forbindelse med færdiggørelsen og valideringen er det også centralt at udfærdige en operationel beredskabsplan på baggrund af en systematisk gennemgang af de risici, der er ved at bruge en algoritmebaseret model til eksempelvis beslutningsstøtte eller automatiserede beslutninger.


Lancering og drift

Ud over en løbende vurdering af et projekts risici, anbefaler Deloitte, at der i forberedelsen af lanceringen gennemføres en systematisk risikovurdering af løsningens påvirkning på organisationen bredt. Systematikken kan eksempelvis opnås ved at gennemgå hele værdikæden fra udviklingsprocessen til drift og vedligehold. Dette omfatter introduktion og træning af brugere, således at modellen fortolkes og anvendes korrekt og med forståelse for eventuelle begrænsninger. Det drejer sig om at have aftaler vedrørende den løbende drift af modellen og datagrundlaget inkl. overvågning af inputdata og deres kvalitet, komplethed og aktualitet. Typisk vil modeller også skulle vedligeholdes og genvurderes, for at sikre, at forklaringskraften fortsat gælder. Denne aktivitet kan med fordel lægges i en fast ramme såsom et årshjul, og der er et ledelsesmæssigt ansvar forbundet med denne opfølgning.

Endelig er det som med al anden krisehåndtering en god ide at have en beredskabsplan, som sikrer involvering af de rette i organisationen og en håndtering af eventuelle problemer forbundet med anvendelse af modellen.


Risikovurdering og etik

Når risikovurderingen af algoritmer omfatter et etisk element, er det nødvendigt at anskue de risici, som ikke alene påvirker organisationen, men også de eksterne parter. Dette er ikke et fuldstændigt nyt, da det blandt andet også findes i stakeholder value-begrebet, hvor pointen ligeledes er, at beslutninger også påvirker eksterne parter, og at konsekvenserne for dem kan falde tilbage på organisationen.

Hvis en risikovurdering dermed også indeholder en systematisk vurdering af, hvordan eksterne parter påvirkes, fordi de direkte eller indirekte påvirkes af algoritmen, får organisationen et bedre og bredere grundlag for at vurdere, om en løsning er god. I en sådan risikovurdering er det relevant at benytte sig af en særlig struktureret tilgang. Når forskellige fordele og ulemper derefter vejes op mod hinanden, er det i sidste ende en afgørelse, der tages af ledelsen, som også bærer ansvaret.

Et element i dette er, at en model altid bør søge at afspejle nutiden og nuværende vurderinger frem for en historisk vurdering baseret på historiske data. Det medfører et løbende krav om gen-træning og validering af modellen, ud over den løbende sikring at datagrundlagets kvalitet, og at der er en kendt proces for at håndtere evt. kvalitetsproblemer og dermed, at modellen ikke giver et retvisende resultat.


Grundlaget for etisk brug af data

Dårlige data påvirker resultatet. Det kan vise sig på forskellig vis som enkelte stærkt afvigende resultater eller generelle tendenser (eller begge dele).

Når en algoritme sættes i drift, er det dermed væsentligt at definere og sikre inputtets kvalitet. Der vil være modeller, hvor det er afgørende med meget høj præcision og andre, som er mere robuste.

Hvis en model skal kunne op- og nedskaleres i omfang og ydeevne, er det væsentligt at automatisere overvågningen og have procedurer for, hvordan kvalitetsbrister rapporteres og håndteres, ligesom registreringer og øvrige dataopsamlinger forbedres løbende. Den risikobaserede tilgang er hensigtsmæssig til at lokalisere, hvilke datafejl der er vigtige at få rettet. Mængden af fejl i data bliver ofte undervurderet, og det er ofte urealistisk at tro, at alle fejl kan blive rettet. Det er bedste praksis ikke blot at rette dataene, men også kilden.


Fra pilot til produktion

Skridtet fra et lovende pilotprojekt til en produktionsmoden løsning er stort. Det er kompliceret at indarbejde en sådan i helt eller delvist automatiserede processer og leve op til høje privacy-standarder.

Derfor skal overgangen forberedes på flere måder. Det er således vigtigt, at der sættes ressourcer af til at følge og vedligeholde modellen og datagrundlaget. Ellers ’vinder virkeligheden’ over tid og det kan ske, at en vel gennemtænkt og udarbejdet model med tiden bliver til en dårlig model, som eksempelvis identificerer åbenlyst urimelige anbefalinger, uretfærdigheder eller andre uhensigtsmæssige forhold, der gør, at tilliden til modellen forsvinder.

Opsummering 

Etisk brug af data ligger i forlængelse af sikringen af privatliv og fortroligheden omkring data - særligt vedrørende persondata. Ærlighed og troværdige etiske standarder er væsentlige i forhold til kontekst, så data kun bruges til det, som der er givet adgang til, via samtykke eller lovgivning.

For at fremme dialogen om etisk brug af data er her nogle forslag til systematikken i udviklingsprojekter:

  • Er der tale om en engangsanalyse, som kan have gode og valide formål, og som kan bruges til at validere en hypotese og forberede brug af data?
  • Er der tale om udvikling af algoritmer til produktion?

        - Kan den forklares, og er den neutral og fordomsfri?

        - Er der tilstrækkeligt uddannede brugere?

        - Er der en plan for overvågning og gen-validering?

        - Bliver den løbende vedligeholdt og forbedret?

        - Har den en forretningsejer, som kan træffe beslutninger på grundlag af algoritmen, og som har ansvaret for beredskab ved spørgsmål eller problemer?

        - Er datagrundlagets kvalitet kendt og tilstrækkeligt?

        - Er der et ærligt og solidt grundlag for data til udviklingen og data til løbende brug af algoritmen?

Definition

Dataetik er ansvarlig og bæredygtig brug af data. Det er det “rigtige” at gøre i forhold til mennesker og samfund. Dataprocesser bør derfor være designet som bredt bæredygtige løsninger – dvs. først og fremmest til gavn for mennesker, tænkt bredt på tværs af, hvem der direkte eller indirekte bliver påvirket af en løsning.

Dataetik handler om at opfylde de principper og værdier, som menneskerettighederne og persondatalovgivningen bygger på. Det handler om ærlig og ægte gennemsigtighed i datahåndteringen. En del af dette er, aktivt at udvikle privacy by design og privacy-fremmende produkter og strukturer. Om at behandle andres personlige oplysninger som man selv ønsker ens egne – eller ens børns – skal behandles.[1]


[1] Definition fra https://dataethics.eu/wp-content/uploads/Dataetik-dk.pdf

Fandt du dette nyttigt?