Komórka bakteryjna syntetyzuje tysiące różnych polipeptydów. Sekwencja tych polipeptydów (dokładna liczba aminokwasów od N- do C-końca) jest zakodowana w DNA organizmu. Genom większości bakterii to dwuniciowa, kolista cząsteczka DNA o długości milionów par zasad. Każdy polipeptyd jest kodowany przez specyficzny region tej cząsteczki DNA. Tak więc, nasze pytania są, jak są specyficzne regiony w DNA rozpoznawane i jak jest informacja obecna w kwasie nukleinowym-sekwencji przetłumaczone na sekwencję polipeptydów.
Aby odpowiedzieć na pierwsze pytanie, pomyślmy z powrotem do struktury DNA. Było od razu oczywiste, że jednowymiarowa sekwencja polipeptydu może być zakodowana w jednowymiarowej sekwencji łańcuchów polinukleotydowych w cząsteczce DNA231. Prawdziwym pytaniem było, jak przetłumaczyć język kwasów nukleinowych, który składa się z sekwencji czterech różnych zasad nukleotydowych, na język polipeptydów, który składa się z sekwencji 20 (lub 22) różnych aminokwasów. Jak zauważył fizyk George Gamow (1904-1968)232 minimalny zestaw nukleotydów potrzebny do zakodowania wszystkich 20 aminokwasów wynosi trzy; sekwencja jednego nukleotydu (41) mogłaby zakodować co najwyżej cztery różne animokwasy, sekwencja o długości dwóch nukleotydów mogłaby zakodować (42) lub 16 różnych aminokwasów (za mało), natomiast sekwencja trzech nukleotydów (43) mogłaby zakodować 64 różne aminokwasy (więcej niż wystarczająco)233. Chociaż rzeczywisty schemat kodowania, który zaproponował Gamow, był błędny, jego myślenie o możliwościach kodowania DNA wpłynęło na tych, którzy wyruszyli, aby eksperymentalnie określić rzeczywiste reguły „kodu genetycznego”.
Kod genetyczny nie jest samą informacją, ale algorytmem, według którego sekwencje nukleotydów są „odczytywane” w celu określenia sekwencji polipeptydowych. Polipeptyd jest zakodowany przez sekwencję nukleotydów. Ta sekwencja nukleotydów jest odczytywana w grupach po trzy nukleotydy, zwanych kodonami. Kodony odczytywane są w sposób nienakładający się na siebie, bez odstępów (czyli niekodujących nukleotydów) pomiędzy nimi. Ponieważ istnieją 64 możliwe kodony, a tylko 20 (lub 22 – patrz wyżej) różnych aminokwasów używanych w organizmach, kod jest redundantny, to znaczy, że pewne aminokwasy są kodowane przez więcej niż jeden kodon. Ponadto istnieją trzy kodony, UAA, UAG i UGA, które nie kodują żadnego aminokwasu, ale są używane do oznaczania końca polipeptydu, kodują „przystanki” lub okresy.
Region kwasu nukleinowego, który koduje polipeptyd, zaczyna się od tego, co jest znane jako kodon „start” i trwa do momentu osiągnięcia jednego z trzech kodonów „stop”. Sekwencja określona przez kodony startu i stopu w ramce (z pewną liczbą kodonów pomiędzy nimi) jest znana jako otwarta ramka odczytu lub ORF. W tym miejscu należy wyraźnie zaznaczyć, że chociaż informacja kodująca polipeptyd jest obecna w DNA, to nie jest ona bezpośrednio wykorzystywana do specyficznej sekwencji polipeptydu. Proces ten ma raczej charakter pośredni. Informacja zawarta w DNA jest najpierw kopiowana do cząsteczki RNA (znanej jako RNA posłańca) i to właśnie ta cząsteczka RNA kieruje syntezą polipeptydu. Proces wykorzystywania informacji z DNA do kierowania syntezą cząsteczki RNA jest znany jako transkrypcja, ponieważ zarówno DNA, jak i RNA posługują się tym samym językiem, sekwencjami nukleotydów. Natomiast polipeptydy są zapisane w innym języku, sekwencjach aminokwasów. Z tego powodu proces syntezy polipeptydów kierowanej przez RNA znany jest jako translacja.
Wydawcy i przypisy
-
Michael W. Klymkowsky (University of Colorado Boulder) i Melanie M. Cooper (Michigan State University) ze znaczącym wkładem Eminy Begovic & pewna pomoc redakcyjna Rebecca Klymkowsky.
.