Processing math: 100%

Kan vi bestemme forbryderens udseende ud fra et DNA-spor?

Forstil dig, at politiet finder et DNA-spor på et gerningssted. I dag kan politiet bruge DNA-sporet til at undersøge om det passer til en DNA-profil for en kriminel i politiets registre. Politiet kan også sammenligne en mistænkt persons DNA-profil med et DNA-spor fra forbrydelsen.

I fremtiden kan politiet bruge DNA-spor til at forudse forbryderens udseende, så udseendet kan bruges i opklaringsarbejdet. Man begynder at kunne forudse dele af et menneskes udseende ud fra DNA-materiale. Øjenfarve er en af de første karakteristika, man kan forudse. 

Du har nok hørt om AI = Artificial Intelligens eller kunstig intelligens. I dette forløb vil vi vise dig et eksempel på, hvordan AI kan bruges. Machine learning (ML) er et bedre navn end AI. Machine Learning fortæller nemlig, at computeren lærer ud fra noget data og derefter forudser nyt.

 

 

Tak til

Vi er blevet inspireret til dette forløb af Morten Wiuf og Marie-Louise Kampmann på Retsmedicinsk Institut på Københavns Universitet. Hvis du er blevet interesseret i lave SRP indenfor dette emne, holder instituttet en gang om året en SRP-dag for 3.g-elever, som vil skrive SRP i et emne indenfor det restmedicinske område. 

Projektet er en del af dataekspeditioner, som huses af Datalogisk Institut på Københavns Universitet og finansieres af Novo Nordisk Fonden. 

Videoer med baggrundsviden om biologien
Melanin og øjenfarve

Lidt baggrund om menneskers øjenfarve

Genome wide association study

En video om hvordan man bestemmer hvilke mutationer, der kan have betydning for øjenfarven.

Videoer med hjælp til orange

I værktøjskassen ligger videoer om Machine Learning modeller til billedegenkendelse. Ikke alle bruges i matematikforløbet, men kan være interessant for elever, som ønsker at lave SRP om Machine Learning

Import af data til Orange

Her kan du se hvordan du importerer data til Orange og hvordan du viser de data, du har importeret.

Forbered Orange til billedanalyse

Her kan du se hvordan du får installeret udvidelsen “Image Analytics” i Orange

Hent billeder ind i Orange

Her kan du se hvordan du henter billeder ind i Orange og hvordan billeder skal behandles, så de kan bruges i Machine Learning modeller. 

Træn Orange til at kategorisere billeder

Her kan du se hvordan du træner Machine Learning modeller i Orange til at kategorisere billeder og hvordan du kan undersøge hvilke billeder modellen har svært ved at kategorisere. 

Brug en model til at forudse kategori for nye billeder

Her kan du se hvordan du kan bruge din Machine Learning model til at kategorisere nye billeder. 

Videoer med hjælp til Maple
Import af data til Maple

Her kan du se hvordan du importerer data fra et excelark  til Maple

1 - Intro til Machine Learning

        

I dette modul skal du lave en Machine Learning model, som kan forudse en persons køn. Du lærer hvordan it-systemer i dag kan trænes til at forudse forskellige ting ud fra nogle data. 

Du skal
  • undersøge Machine Learning modellen kNN sammen med dine klassekammerater
  • se en video om Machine Learning
  • installere programmet Orange
  • se en video om programmering i Orange
  • lave dit første Machine Learning program i Orange
  • læse om bias i træningsdata og lave en øvelse om bias

2 - Forudse øjenfarve ud fra DNA

Hjælpe politiet med at forudse 3 gerningsmænds øjenfarve

Forestil dig, at politiets efterforskere sender dig DNA-materiale fra 3 forskellige forbrydelser. Du har derefter behandlet DNA-sporene og undersøgt dem for mutationer, som bestemmer øjenfarven. Nu skal du lave en ML-model, der kan forudse gerningsmændenes øjenfarve.

DNA-fænotyping: fra DNA til gerningsmand

DNA-fænotyping er at bruge DNA til at forudsige, hvordan en person ser ud.  Har politiet fundet et DNA-spor som ikke matcher tidligere gerningsmænd i deres database, kan de bruge DNA-fænotyping til at få information om gerningsmandens udseende. Det svarer til politiets fantomtegninger, men her laves tegningen ud fra DNA sporets information.

I dette modul skal du
  • læse om hvorfor øjne har forskellige farver
  • læse om forskellen på statistisk og Machine Learning
  • lave et program i Orange
  • træne din ML-model
  • teste din ML-model
  • forudse øjenfarven for de 3 DNA-spor, du har modtaget
  • undersøge hvilke mutationer ML-modellen bruger til forudsigelser

3 - Forudse alder ud fra DNA

Udvikling af ML-model til at bestemme en persons alder

Retsmedicinsk institut laver analyser for politiet. De kan f.eks. hjælpe politiet med at bestemme alder, øjen-, hår- og hudfarve, samt etnisk oprindelse. De udvikler løbende nye og bedre metoder. I dette modul skal du prøve at arbejde på samme måde og lave en ML-model til bestemmelse af alder ud fra DNA. 

Matematikken sætter tal på, hvor god ML-modellen er

Politiet har brug for ML-modellen til at bestemme alder ud fra DNA f.eks. i sager hvor:

  • et DNA-spor fra en forbrydelse kan bruges til at bestemme alder på den gerningsmand, som politiet leder efter
  • en flygtning angiver at være under 18 år, men han kan ikke dokumentere det med en fødselsattest og man skal derfor bestemme alderen ud fra en blodprøve

I den første type sager kan politiet acceptere en større usikkerhed på aldersbestemmelsen (f.eks. ±5 år), mens aldersbestemmelsen for flygtninge skal være meget præcis, da der er stor forskel på de rettigheder børn og voksne har som flygtning og en alder under 18 år vil ofte være en fordel for den som søger asyl.

Retsmedicinerne skal bruge matematikken til at vise, hvor præcis deres ML-model er. Vi skal:

  • beregne konfidensinterval for hældningen af en graf fra vores model
  • lave analyse af residualerne for vores model
  • beregne spredning af residualer for vores model

for at vise hvor god vores ML-model er.

I dette modul skal du
  • repetere hvordan du importerer data til dit matematik program (Maple, Nspire eller hvad I bruger på din skole)
  • repetere hvordan du laver almindelig lineær regression i dit matematik program
  • lave en ML-model til aldersbestemmelse ud fra DNA-data
  • lave lineær regression på resultaterne af ML-modellen og analysere residualerne
  • beregne præcisionen af ML-modellen vha. spredningen af resultaterne
  • beregne præcisionen af ML-modellen vha. konfidensinterval for hældning
  • tolke præcisionen af ML-modellen, så du kan fortælle politiet, hvor god din model er

Leave a Reply

Your email address will not be published. Required fields are marked *