Fylogeni

Fylogeni (gr. phylon - rase, slekt; genesis - skapelse, oppstå) - Avstamnings- og utviklingshistorie. Evolusjonshistorien til en organisme og organismegruppe. En evolusjonær sammenheng mellom grupper av organismer. Gir et familietre som viser genetisk sammenheng mellom forfedre og etterkommere.

Molekylær fylogeni

Fylogenetiske trær blir brukt til å beskrive den evolusjonære sammenheng, dynamikk og slektskap mellom arter, livstreet, ”The tree of life”. Slike trær kan også bli brukt til å beskrive den genealogiske relasjonen mellom celler og celletyper i cellelinjer i en kropp, eller til å klassifisere gener, reguleringssekvenser, ikke-kodende RNA og til metagenomikk. Greiningspunktene, nodene i treet representerer spesielle hendelser i en arts utvikling, og greinene er genetiske linjer. Nodene kan representere store evolusjonære forandringer og forskjeller, for eksempel en genduplisering, men også i form av et lite antall basesubstitusjoner per enhet. Treet kan være med eller uten rot.  

Fylogenitre

Genealogi er studiet av opprinnelse og utbredelse, en stamtavle, for menneskeslekten kalt ættegranskning.  I et historisk genealogisk slektstre er lengden på greinene ofte en ukjent parameter. Man kan ikke forvente evolusjonen skjer med konstant hastighet, de molekylære klokker går ujevnt. Den nye generasjon høykapasitets sekvenseringsteknikker, HTSeq, produserer enorme mengder sekvensdata med mye skjult informasjon som krever nye heuristiske algoritmer og regnemetoder, anvendt innen bioinformatikk. Sekvensering av DNA fra mange individer av samme art gjør det mulig å klassifisere individenes DNA til familier anvendt i populasjonsdynamikk, eller til å studere utbredelse og effekt av enkeltbasepolymorfier (snipper, SNP). I rekonstruksjonen av et fylogenetisk tre kan man bruke at avstandsmål, i form av en avstandsmatrise, mellom alle par av sekvenser man har til rådighet. I et karakterbasert mål plasseres alle sekvensene ved siden av hverandre og samstemmes. Deretter sammenlignes alle sekvensene med tanke på forskjeller for hver enkelt base ad gangen gjennom hele sekvensen. I klyngeanalyse velges suksesivt par med taxa. Maksimal parsinomi vil si færrest mulig endringer.  De forskjellige statistiske metodene som anvendes har både fordeler og ulemper. Maksimum likelihoodestimering (MLE) ble introdusert av statistikeren og biologen R.A. Fisher, hvor parameterverdiene i en modell er ukjent, men hvor man bruker datasettet til å estimere parameterverdiene for å finne via optimaliseringsteknikker hvilken parameterverdi som er mest sannsynlig, gitt datasettet. I en likelihood ratio test kan man undersøke hvor godt tilpasset en evolusjonær modell er, hvor man sammenligner to nestete modeller og bruker kjikvadratfordelingen.

I Bayesiansk statistikk har man sammenhengen:

posterior sannsynlighetsfordeling = likelihood· prior sannsynlighetsfordeling

jfr. a priori- på forhånd, fra det foregående, forhåndskunnskap,  a posteriori – i ettertid, fra erfaringen

Bayesiansk inferens er basert på posterior  sannsynlighetsfordeling hvor parameterne betraktes som stokastiske variable.

Tilbake til hovedside

Publisert 4. feb. 2011 10:21 - Sist endret 14. okt. 2019 11:04