Bakteriální buňka syntetizuje tisíce různých polypeptidů. Sekvence těchto polypeptidů (přesné aminokyseliny od N- do C-konce) je zakódována v DNA organismu. Genom většiny bakterií je dvouřetězcová kruhová molekula DNA o délce milionů párů bází. Každý polypeptid je kódován určitou oblastí této molekuly DNA. Naše otázky tedy zní, jak jsou rozpoznávány specifické oblasti v DNA a jak je informace obsažená v sekvenci nukleových kyselin překládána do sekvence polypeptidů.
K řešení první otázky se vraťme ke struktuře DNA. Bylo okamžitě zřejmé, že jednorozměrná sekvence polypeptidu může být zakódována v jednorozměrné sekvenci polynukleotidových řetězců v molekule DNA231. Skutečnou otázkou bylo, jak přeložit jazyk nukleových kyselin, který se skládá ze sekvencí čtyř různých nukleotidových bází, do jazyka polypeptidů, který se skládá ze sekvencí 20 (nebo 22) různých aminokyselin. Jak upozornil fyzik George Gamow (1904-1968)232 , minimální soubor nukleotidů potřebný ke kódování všech 20 aminokyselin jsou tři; sekvence o délce jednoho nukleotidu (41) by mohla kódovat nanejvýš čtyři různé animokyseliny, sekvence o délce dvou nukleotidů by mohla kódovat (42) nebo 16 různých aminokyselin (což nestačí), zatímco sekvence o délce tří nukleotidů (43) by mohla kódovat 64 různých aminokyselin (což je více než dost)233 . Přestože skutečné kódovací schéma, které Gamow navrhl, bylo chybné, jeho úvahy o kódovací kapacitě DNA ovlivnily ty, kteří se pustili do experimentálního určování skutečných pravidel „genetického kódu“.
Genetický kód není samotná informace, ale algoritmus, podle kterého se „čtou“ sekvence nukleotidů, aby se určily sekvence polypeptidů. Polypeptid je kódován sekvencí nukleotidů. Tato sekvence nukleotidů se čte ve skupinách po třech nukleotidech, známých jako kodon. Kodony se čtou nepřekrývající se, bez mezer (tj. nekódujících nukleotidů) mezi nimi. Protože existuje 64 možných kodonů, ale pouze 20 (nebo 22 – viz výše) různých aminokyselin používaných v organismech, je kód redundantní, to znamená, že některé aminokyseliny jsou kódovány více než jedním kodonem. Kromě toho existují tři kodony, UAA, UAG a UGA, které nekódují žádnou aminokyselinu, ale používají se k označení konce polypeptidu, kódují „stop“ neboli tečky.
Oblast nukleové kyseliny, která kóduje polypeptid, začíná tzv. start kodonem a pokračuje až k jednomu ze tří stop kodonů. Sekvence vymezená start a stop kodony v rámci (s určitým počtem kodonů mezi nimi) se nazývá otevřený čtecí rámec neboli ORF. Na tomto místě je důležité výslovně zdůraznit, že ačkoli je informace kódující polypeptid přítomna v DNA, tato informace se nepoužívá přímo ke specifické sekvenci polypeptidu. Tento proces je spíše nepřímý. Informace v DNA se nejprve zkopíruje do molekuly RNA (známé jako messengerová RNA) a právě tato molekula RNA řídí syntézu polypeptidu. Proces využití informace v DNA k řízení syntézy molekuly RNA se nazývá transkripce, protože DNA i RNA používají stejný jazyk, sekvence nukleotidů. Naproti tomu polypeptidy jsou psány jiným jazykem, sekvencemi aminokyselin. Z tohoto důvodu se proces syntézy polypeptidů řízené RNA nazývá translace.
Přispěvatelé a atributy
-
Michael W. Klymkowsky (University of Colorado Boulder) a Melanie M. Cooper (Michigan State University) za významného přispění Eminy Begovic & s určitou redakční pomocí Rebeccy Klymkowsky.
.