Bioinformatikk

Utvikling av dataprogrammer og algoritmer som verktøy til å klassifisere, visualisere og strukturere store datamengder fra organismer og biologiske systemer blant annet nukleinsyresekvenser og aminosyresekvenser. Protein- g molekylstrukturer, styrt (veiledet)-  og ikke-styrt maskinlæring, visualisering, genomstudier, DNA-barkoding, genfunksjoner, genregulering, metabolske nettverk og systembiologi, nettverk med molekylære interaksjoner, bildeanalyse, databaser tilknyttet internett og APIer), fylogeni, nevrale nettverk m.fl. En algoritme er en prosedyre eller regneoperasjon som utfører en utregning. 

 

Den amerikanske biokjemikeren Margareth Oakley Dayhoff (1925-1983) var med å utvikle trebokstavkoden for aminosyrer og er en av grunnleggerne av fagområdet bioinformatikk. Dayhoff studerte substitusjonsmatriser hvordan det skjer endringer i nukleinsyrekoden eller aminosyresekvensen i proteiner via evolusjon. Hun laget i 1965 et atlas for alle på den kjente aminosyresekvenser i protein Atlas of Protein Sequence and Structure. Den britiske biokjemikeren og doble nobelprisvinneren rederick Sanger (1918 – 19- 2013) fikk i 1958 nobelprisen i kjemi for å ha bestemt aminosyresekvensen i insulin «or hans arbeid med strukturen til proteiner, spesielt insulin».  Sanger fikk også nobelprisen i kjemi i 1980 sammen med Walter Gilbert og Paul Berg «for deres bidrag til bestemmelsen av basesekvensen i nukleinsyrer».

Det arbeides med å gensekvensere alle Jordens kjente organismer og alle nukleinsyresekvensene og aminosyresekvensene er lagret i store databaser. 

AI og bioinformatikk

Med kunstig intelligens (AI) har dataselskapet DeepMind, eid av Googleselskapet  Alphabet laget dataprogrammet AlphaFold som ut fra aminosyresekvensen lager tredimensjonale modeller av alle typer proteiner. AlphaFold predikterer 3D-koordinatene for alle atomene som inngår i mer enn 100000 kjente proteiner. 

Søk etter homologe sekvenser og enkeltbasepolymorfier koblet til sykdommer, søk etter gener, 3D-konstruksjon av kromosomer.Modellering av av noder nervecellekontakt i hjernen i nevrale nettverk. Bildeanalyse innen diagnostikk av sykdommer.

Programmeringsspråk

Flere av de bioloinformatiske verktøyene erI objektorienterte programmeringsspråk slik som Python, R , JAVA og C++. Et objekt er deler av et dataprogram og objektene inneholder metoder bestående av prosedyrer og algoritmer. Når man lager et objekt blir det dannet en klasse som bestemmer objektet. Navnet på klassen angis etter class etterfulgt av klammeparentes som inneholder og innkapsler alt som tilhører klasse.  Det finnes ferdige objekttyper og klassebibliotek.

Kristen Nygaard og Ole-Johan Dahl ved Norsk Regnesentral var pionérer i utvikling av objektorientert programmering med SIMULA på 1960-tallet.

Litteratur

Wikipedia

Tilbake til hovedside

Publisert 12. juli 2022 11:45 - Sist endret 22. nov. 2023 14:04