De biologiske sekvensbokstavene er for nukleinsyrene forbokstavene:
A, T, G, og C i DNA.
A, C, G og U i RNA.
A, R, N, D, B, C, Q, E, Z, G, H, I, L, K, M, F, P, S, T, W, Y, V for aminosyrer i protein og peptider.
I en sekvenseringsprosess for nukleinsyrer får man korte sekvensavlesninger f.eks. 100 basepar lagret i fastq-filformat med kvalitetssikring av avlesningen. Overlappende sekvensavlesninger samles og skjøtes i contigs. Sekvenseringsteknologien og hva som menes med "korte" sekvensavlesninger ("reads") utvikler seg meget raskt. DNA-sekvensering og RNA-sekvensering (RNAseq) er grunnleggende teknikker anvendt innen evolusjonær taksonomi, artsidentifisering via barkoding (strekkoding), og har stor anvendelse innen medisin og leting etter enkeltbasepolymorfier og hva de kan forklare av biokjemiske og fysiologiske forskjeller mellom individer.