Disputas: Øyvind Bleka

M.Sc. Øyvind Bleka ved Matematisk institutt vil forsvare sin avhandling for graden ph.d.:

Improved analysis of complex DNA profiles and the interrogation of very large national DNA databases

Øyvind Bleka

Tid og sted for prøveforelesning

5. desember 2016 kl. 10.15,  Aud. 4 Vilhelm Bjerknes' hus

Bedømmelseskomité

  • Assistant Professor Mikkel Meyer Andersen, Aalborg Universitet
  • Professor Jarle Tufto, Norwegian University of Science and Technology
  • Professor Sven Ove Samuelsen, Universitetet i Oslo

Leder av disputas

Instituttleder Arne Huseby, Matematisk institutt, Universitet i Oslo

Veiledere

  • Peter Gill, Folkehelseinstituttet
  • Geir Storvik, Universitetet i Oslo
  • Thore Egeland, Norges miljø- og biovitenskapelige universitet

Sammendrag

I denne avhandlingen utvikles og implementeres et statistisk verktøy for analysering av kompliserte DNA-profiler. Dette verktøyet har stor praktisk betydning innen rettsgenetiske anvendelser siden det bidrar til å øke muligheten for å identifisere personer i kompliserte DNA-profiler.

Siden 1986 har DNA blitt brukt til å identifisere personer som har avsatt biologiske spor. Dataene som brukes til slik identifisering kalles DNA-profiler. Dette er data basert på oppkopiert DNA som består av tallrekker med tilhørende topphøyder. Disse tallrekkene beskriver informasjonen på små områder av DNA-et som finnes i personers cellekjerner. De tilhørende topphøydene gjenspeiler mengde DNA som ulike personer har avsatt. DNA-profiler basert på celler fra minst to personer i kombinasjon med artefakter gir kompliserte profiler som er svært vanskelige å fortolke.

Denne avhandlingen omhandler metoder for å sammenligne referanseprofiler til kjente personer mot kompliserte DNA-profiler, med formål for identifisering. Det anbefalte målet for slik sammenligning kalles «likelihood ratio» (LR), som gir en tallvekt på hvor mye mer sannsynlig det er å observere DNA-profilen når referansen inngår i DNA-profilen, kontra ikke. For slik sammenligning finnes det to typer statistiske modeller: (A) kvalitative, der informasjonen om tallrekkene, og hvor hyppig forekommende disse er, benyttes - og (B) kontinuerlige, der også topphøydeinformasjonen inkluderes. Modellene for (B) er mer kompliserte enn (A), og muliggjør separering av ukjente komponenter innen en DNA-profil. Hittil har modelltype (B) krevd en kommersiell lisens for å benyttes.

Første del av avhandlingen omhandler databasesøk, der hensikten er å søke etter personer i en nasjonal DNA-database som inngår i en DNA-profil. Dette er krevende når man har kompliserte DNA-profiler og databasen er stor. Avhandlingen demonstrer viktigheten av å bruke LR-basert sammenligningsmetode fremfor enkel tallrekke-sammenligning, siden denne metoden reduserer antall falske positive.

I første del av avhandlingen, som omhandler databasesøk, brukes modelltype (A), mens i andre del videreutvikles og implementeres en statistisk modell av modelltype (B). Dette har resultert i det fritt tilgjengelige brukervennlige programmet EuroForMix, der kildekoden er offentlig tilgjengelig. En viktig del av avhandlingen har vært å bruke reelle kompliserte DNA-profiler til å demonstrere at den utviklede modellen gjør identifisering bedre enn allerede-eksisterende alternative modeller av modelltype (A). Dette gjelder spesielt for DNA-profiler der høydeinformasjonen til ukjente komponenter fanges opp av den kontinuerlige modellen..

For mer informasjon

Kontakt Matematisk institutt.

Publisert 31. okt. 2016 09:50 - Sist endret 21. nov. 2016 09:20