Sekvensering

Sekvensering - Bestemmelse av rekkefølgen av baser i DNA, RNA eller rekkefølgen av aminosyrer i protein. DNA kan sekvenseres etter nobelprisvinneren Frederick Sangers kjedetermineringsmetode: Først må man ha et stykke (fragment) med enkelttrådet DNA som skal sekvenseres, vanligvis ca. 200 basepar. Dette kan man få tak i ved å kutte DNA med restriksjonsenzymer, etterfulgt av denaturering som gir enkelttrådet DNA. Hvis man kutter DNA med flere forskjellige restriksjonsenzymer og bestemmer sekvensen av de overlappende stykkene er det mulig å få sekvensert lange stykker med DNA. Stykket med enkelttrådet DNA må renses med elektroforese og deretter bli klonet inn i en vektor f.eks. M13, BAC, YAC før sekvensering. Sekvenseringsmetoden baserer seg på polyakrylamid gelelektroforese og dideoksynukleotider. Dideoksynukleotidene har ikke frie hydroksylgrupper i 2´og 3´posisjon på ribose og disse kan derfor ikke danne fosfodiesterbinding med neste dideoksynukleotid. Dideoksynukleotidene terminerer derfor DNA-sekvensen der de blir satt inn.

Sekvensering frimerke

For å sekvensere et stykke DNA trenger man 4 eppendorfrør, ett for henholdsvis hver av de fire dideoksynukleotidene ddATP, ddTTP, ddGTP og ddCTP. Alle de fire rørene inneholder i tillegg fragmentet med enkelttrådet DNA som skal sekvenseres, en radioaktivt merket primer som binder seg til den ukjente sekvensen og virker som templat, DNA polymerase og de 4 vanlige deoksynukleotidene dATP, dTTP, dGTP og dCTP. F.eks. røret som inneholder ddATP vil man når man kommer til en A som skal lage par med T på templattråden vil i noen tilfeller ddATP binde seg og terminere kjeden. Imidlertid er dATP i overskudd i DNA-sekvensen forlenges til neste gang man kommer til en A og det hele gjentar seg at noen ddATP bindes istedet for dATP. Etter en bestemt tid stoppes reaksjonen i de fire rørene ved tilsetting av formamid og med høy temperatur lages enkelttrådet DNA. Hver av de 4 rørene har en tilsvarende brønn på en tynn denaturerende polyakrylamidgel tilsatt urea. Høy spenning (over 1000 volt) mellom anode og katode atskiller DNA-fragmentene hvor de korteste stykkene vandrer lengst på gelen. Etterpå fikseres gelen med eddiksyre, dekkes med filtrerpapir og plastfolie for deretter å bli vakuumtørket. Deretter kan den tørkete gelen legges på røntgenfilm og de forskjellige fragmentene sverter røntgenfilmen. Deretter kan den ukjente DNA sekvensen direkte avleses på gelen. Med moderne utstyr er sekvenseringen automatisert og den radioaktive primeren er erstattet med fire forskjellige fluorescerende farger for å merke dideoksynukleotidene. Den karakteristiske fluorescensen for hver av dideoksynukleotidene avleses med en laserstråle. Sammen med utviklingen av bioinformatikk har dette gjort det mulig å sekvensere store genomer fra mange forskjellige typer organismer.

Sekvensering Sanger

Sekvensering

Figuren viser sekvensering av DNAetter Sangers kjedetermineringsmetode, som er blitt erstattet av mer morderne metoder med høyere kapasitet..

Helgenomsekvensering

Bestemme sekvensen av alle nukleotidene i genomet i en organisme, og omfatter alt DNA i kromosomer i cellekjernen, for mennesket i alt n=23 kromosomer, samt DNA i mitokondrier og i tillegg DNA i kloroplaster hos planter.  De første sekvenseringsteknikkene som ble utviklet baserte seg på Maxam-Gilbert sekvensering og Sanger sekvensering. Den første bakterien som ble helgenomsekvensert med «hagleskuddmetoden» var Haemophilus influenzae. Hagleskuddmetoden består i å dele opp hele DNA i korte mindre deler, og deretter klone disse bitene inn DNA biblioteker, enten i form av bakterielle kunstige kromosomer (BAC, «bacterial artificial chromosomes») eller gjær kunstige kromosomer (YAC, «yeast artificial chromosomes»). Alle småbitene blir sekvensert, og deretter bruker man datamaskiner med dataprogrammer (algoritmer) som skjøter bitene sammen, blant annet brukt av TIGR (The Institute for Genomic Research). Sekvensering genererer store mengder data og krever stor regnemaskinkapasitet i et eget fagområde kalt bioinformatikk.

 Bakegjær (Saccharomyces cerevisae) er en eukaryot encellet organisme og har et genom med 12 millioner basepar og ble sekvensert i 1996. Nematoden Caenorhabditis elegans ble sekvensert i 1998. Det andre virvelløse dyret som ble sekvensert var bananfluen (Drosophila melanogaster) i år 2000, utført av  firmaet Celera Genomics grunnlagt av Graig Venter. År 2000 ble planten vårskrinneblom (Arabidopsis thaliana) sekvensert. Genomet til laboratoriemus (Mus musculus) var ferdig sekvensert i 2002.

Det ble etter hvert utviklet høykapasitets «neste generasjons» sekvenserings metoder med kapillær sekvensering. I stedet for radioaktivt merkete nukleotider som man brukte i begynnelsen ble disse erstattet med nukleotider med forskjellige fluoriserende fargestoffer (Illumina fargesekvensering, pyrosekvensering osv.) . Kapillær sekvensering ble erstattet av nanoporesekvensering. Genomsekvensering er blitt til industri, industrilokaler fylt med de mest moderne sekvenseringsmaksinene.  

RNA-sekvensering (RNAseq)

Sekvensen til alle mRNA fra transkriberte gener på et gitt tidspunkt, transkriptomet. RNA-fragmenter blir reverst transkribert til cDNA (kopiDNA). Deretter blir cDNA-fragmentene ligert med adaptere for så å bli sekvensert. Hvert cDNA blir sekvensert til en "read". Man teller antall molekyler med mRNA for hvert gen. Jo større antall RNA-fragmenter, desto flere reads per kodende område. Gener som uttrykkes sterkt har flere mRNA, noe som gir flere cDNA og derav flere reads. Hvert fragment alinjeres med kjente genomsekvenser. Det er lettere å analysere mRNAfrekvens enn proteinfrekvens, men det behøver nødvendigvis ikke være noen lineær sammenheng mellom dem. Proteomet er summen av alle proteiner i en celle eller organisme. Studiet av proteomet kalles proteomikk.

For mange arter er det krevende å oppformere dem i kultur i laboratoriet, men istedet kan man bruke oppformering av gener og bruke dem til artsidentifisering og fylogenetiske studier. Carl Woese (1928-2012) var en av de første som benyttet genet som koder for  16S ribosomalt RNA (16S rRNA) fra prokaryoter til studium av fylogenetisk taksonomi hos bakterier i Bacteria og Archaea 16S rRNA er den lille subenheten til 30S ribosomet fra prokaryoter, som binder Shine-Dalgarno-sekvenser og har ni hypervariable områder. RNA er vanligvis enkelttrådet, bortsett fra dobbelttrådet små RNA. RNA har basen uracil (U) istedet for thymin (T), og sukkeret er ribose med en hydroksylgruppe istedet for deoksyribose i DNA. Generelt er RNA mye mer ustabilt enn DNA.

Hos eukaryoter anvender man genet  som koder for 18S rRNA den lille subheten til ribosomer. I en prosess med isolering av total mengde RNA starter man med celler som lyseres, og deretter fjerner man DNA med enzymet DNAase. Det gjøres med løsnings- og kjemikaliesett (kits) som man kjøper fra firmaer som produserer disse. F.eks. kan et slikt kit inneholde en kolonne som binder og som kan sentrifugeres. Man vasker kolonnen med bufferløsninger, og eluerer ut RNA med en buffer. Hvor mye nukleinsyrer man har fått eluert ut, og hvor rent det er, kan undersøkes ved å ta ut en prøve og måle i et spektrofotometer absorbsjon av UV-lys med bølgelengde 260 nm som blir absorbert  av nukleinsyrer, og sammenligne med absorbsjonen ved 280 nm som blir absorbert av aromatiske aminosyrer i proteiner. Deretter oversettes RNA til kopi DNA (cDNA) med hjelp av enzymet revers transkriptase. Med primere, dNTP og varmestabil Taq-polymerase utføres PCR i et vekslende temperaturprogram med denaturering, annilering og elongering får man oppformert (amplifisert) det genet man har primer til.  cDNA blir bundet til en kolonne, vasket, sentrifugert og eluert ut av kolonnen. Ved molekylær kloning settes DNA-fragmentene (PCR-produktene) inn i en kloningsvektor. Vektoren innteholder en promoter, replikasjonsstart, kloningsseter hvor det kan kuttes med restriksjonsenzymer og hvor det er mulig ligere inn DNA-fragmente. Kloningsvektoren inneholder også gener for antibiotikaresistens, vanligvis for kanamycin eller ampicillin. Vektoren inneholder ofte beta-glukosidase som spalter et fargestoff (X-gal) som gjør det mulig å identifisere bakteriekolonier som inneholder kloningsvektoren. Kloningsvektoren settes inn i kompetente celler med bakterien Escherichia coli (E.coli).  Kompetente vil si at de er behandlet slik at de kan ta opp kloningsvektoren. E.coli oppformes først i et medium, og spres deretter utover agarplater med vekstmedium og X-gal. Med PCR oppformerer man genene fra bakteriekolonier som er blitt transformert. Først sjekker man renheten på PCR-produktet ved gelektroforese på agarosegel og med et stoff som binder seg til DNA og absorberer UV-lys kan man se på kvalitetene av de endelige rensete PCR-produktene som blir deretter sendt til sekvensering. Ofte bruker man både forover og revers primer for å kunne foreta både forover og revers sekvensering. Etter høykapasitets sekvensering analyseres gensekvensene og sammenlignes med kjente sekvenser f.eks. via BLAST (Basal lokal alinjering søkeverktøy)  og på basis av sannsynligheter gjøres fylogenetisk analyse eller artsidentifisering.  

Tilbake til hovedside

 

Publisert 4. feb. 2011 10:48 - Sist endret 13. feb. 2021 14:35