En bakteriecell syntetiserar tusentals olika polypeptider. Sekvensen av dessa polypeptider (de exakta aminosyrorna från N- till C-terminal) är kodad i organismens DNA. Genomet hos de flesta bakterier är en dubbelsträngad cirkulär DNA-molekyl som är miljontals baspar lång. Varje polypeptid kodas av en specifik region i denna DNA-molekyl. Våra frågor är alltså hur specifika regioner i DNA:t känns igen och hur den information som finns i nukleinsyrasekvensen översätts till polypeptidsekvens.
För att besvara den första frågan låt oss tänka tillbaka på DNA:s struktur. Det var omedelbart uppenbart att den endimensionella sekvensen av en polypeptid kunde kodas i den endimensionella sekvensen av polynukleotidkedjorna i en DNA-molekyl231. Den verkliga frågan var hur man kunde översätta nukleinsyrornas språk, som består av sekvenser av fyra olika nukleotidbaser, till polypeptidernas språk, som består av sekvenser av de 20 (eller 22) olika aminosyrorna. Som fysikern George Gamow (1904-1968)232 påpekade är den minsta uppsättning nukleotider som behövs för att koda alla 20 aminosyror tre; en sekvens av en nukleotid (41) skulle kunna koda högst fyra olika aminosyror, en sekvens på två nukleotider skulle kunna koda (42) eller 16 olika aminosyror (otillräckligt), medan en sekvens av tre nukleotider (43) skulle kunna koda 64 olika aminosyror (mer än tillräckligt)233 . Även om det faktiska kodningsschema som Gamow föreslog var fel, påverkade hans tankegångar om DNA:s kodningskapacitet dem som satte sig för att experimentellt fastställa de faktiska reglerna för den ”genetiska koden”.
Den genetiska koden är inte informationen i sig själv, utan den algoritm genom vilken nukleotidsekvenser ”läses” för att bestämma polypeptidsekvenser. En polypeptid kodas av sekvensen av nukleotider. Nukleotidsekvensen läses i grupper om tre nukleotider, som kallas kodon. Kodonerna läses på ett icke överlappande sätt, utan mellanrum (dvs. icke-kodande nukleotider) mellan dem. Eftersom det finns 64 möjliga kodoner men bara 20 (eller 22 – se ovan) olika aminosyror som används i organismer är koden redundant, dvs. vissa aminosyror kodas av mer än en kodon. Dessutom finns det tre kodoner, UAA, UAG och UGA, som inte kodar för någon aminosyra men som används för att markera slutet på en polypeptid, de kodar för ”stopp” eller perioder.
Den del av nukleinsyran som kodar för en polypeptid börjar med vad som kallas för ”start”-kodonet och fortsätter tills en av de tre stoppkodonerna nås. En sekvens som definieras av start- och stoppkodoner inom ramen (med ett visst antal kodoner mellan dem) kallas en öppen läsram eller en ORF. Här är det viktigt att påpeka att även om informationen som kodar för en polypeptid finns i DNA, används denna information inte direkt för att specificera polypeptidsekvensen. Processen är snarare indirekt. Informationen i DNA kopieras först till en RNA-molekyl (känt som budbärar-RNA) och det är denna RNA-molekyl som styr polypeptidsyntesen. Processen att använda informationen i DNA för att styra syntesen av en RNA-molekyl kallas transkription eftersom både DNA och RNA använder samma språk, nukleotidsekvenser. Polypeptider är däremot skrivna på ett annat språk, aminosyrasekvenser. Av denna anledning kallas processen för RNA-styrd polypeptidsyntes för översättning.
Contributors and Attributions
-
Michael W. Klymkowsky (University of Colorado Boulder) och Melanie M. Cooper (Michigan State University) med betydande bidrag från Emina Begovic & med viss redaktionell hjälp av Rebecca Klymkowsky.