A baktériumsejt több ezer különböző polipeptidet szintetizál. Ezeknek a polipeptideknek a szekvenciája (a pontos aminosavak az N- és a C-terminális között) a szervezet DNS-ében van kódolva. A legtöbb baktérium genomja egy több millió bázispár hosszúságú, kettős szálú, körkörös DNS-molekula. Minden egyes polipeptidet ennek a DNS-molekulának egy meghatározott régiója kódol. Kérdéseink tehát a következők: hogyan ismerik fel a DNS meghatározott régióit, és hogyan fordítják le a nukleinsav-szekvenciában jelen lévő információt polipeptidszekvenciává.
Az első kérdés megválaszolásához gondoljunk vissza a DNS szerkezetére. Azonnal nyilvánvaló volt, hogy egy polipeptid egydimenziós szekvenciája kódolható a DNS-molekulában lévő polinukleotidláncok egydimenziós szekvenciájában231. Az igazi kérdés az volt, hogyan lehet a nukleinsavak nyelvét, amely négy különböző nukleotidbázis szekvenciáiból áll, lefordítani a polipeptidek nyelvére, amely a 20 (vagy 22) különböző aminosav szekvenciáiból áll. Ahogy George Gamow (1904-1968)232 fizikus rámutatott, mind a 20 aminosav kódolásához legalább három nukleotid szükséges; egy egy nukleotidból álló szekvencia (41) legfeljebb négy különböző animósavat kódolhat, egy két nukleotidból álló szekvencia (42) vagy 16 különböző aminosavat (nem elég), míg egy három nukleotidból álló szekvencia (43) 64 különböző aminosavat (több mint elég)233 . Bár a Gamow által javasolt tényleges kódolási séma téves volt, a DNS kódolási képességéről alkotott gondolatmenete befolyásolta azokat, akik kísérletileg nekiláttak a “genetikai kód” tényleges szabályainak meghatározásához.
A genetikai kód nem maga az információ, hanem az az algoritmus, amellyel a nukleotidszekvenciákat a polipeptidszekvenciák meghatározásához “leolvassák”. Egy polipeptidet a nukleotidok szekvenciája kódol. Ezt a nukleotidszekvenciát három nukleotidból álló csoportokban, úgynevezett kodonokban olvassák le. A kodonokat nem átfedő módon olvassák le, és nem hagynak közöttük szóközöket (azaz nem kódoló nukleotidokat). Mivel 64 lehetséges kodon van, de csak 20 (vagy 22 – lásd fentebb) különböző, a szervezetekben használt aminosav létezik, a kód redundáns, azaz bizonyos aminosavakat egynél több kodon kódol. Ezenkívül van három olyan kodon, az UAA, UAG és UGA, amelyek nem kódolnak egyetlen aminosavat sem, hanem a polipeptid végét jelölik, ezek “stopokat” vagy pontokat kódolnak.
A nukleinsavnak a polipeptidet kódoló régiója az úgynevezett “start” kodonnal kezdődik, és addig tart, amíg a három stop kodon egyikét el nem érjük. A keretben lévő start- és stopkódonok által meghatározott szekvenciát (a közöttük lévő bizonyos számú kodonnal) nyílt olvasókeretnek vagy ORF-nek nevezzük. Ezen a ponton fontos kifejezetten rámutatni, hogy bár a polipeptidet kódoló információ jelen van a DNS-ben, ez az információ nem használható fel közvetlenül a polipeptidszekvencia meghatározására. A folyamat inkább közvetett. A DNS-ben lévő információ először egy RNS-molekulába (az úgynevezett hírvivő RNS-be) másolódik, és ez az RNS-molekula irányítja a polipeptidszintézist. A DNS-ben lévő információ felhasználásának folyamatát az RNS-molekula szintézisének irányítására transzkripciónak nevezzük, mivel mind a DNS, mind az RNS ugyanazt a nyelvet, a nukleotidszekvenciákat használja. Ezzel szemben a polipeptidek egy másik nyelven, az aminosav-szekvenciákon íródnak. Ezért az RNS által irányított polipeptidszintézis folyamatát transzlációnak nevezzük.
Megosztók és hozzászólások
-
Michael W. Klymkowsky (University of Colorado Boulder) és Melanie M. Cooper (Michigan State University), Emina Begovic & jelentős közreműködésével.
Rebecca Klymkowsky némi szerkesztői segítséggel.