O celulă bacteriană sintetizează mii de polipeptide diferite. Secvența acestor polipeptide (aminoacizii exacți de la N- la C-terminal) este codificată în ADN-ul organismului. Genomul majorității bacteriilor este o moleculă circulară de ADN dublu catenar care are o lungime de milioane de perechi de baze. Fiecare polipeptidă este codificată de o regiune specifică a acestei molecule de ADN. Așadar, întrebările noastre sunt: cum sunt recunoscute regiunile specifice din ADN și cum este tradusă informația prezentă în secvența de acid nucleic în secvență polipeptidică.
Pentru a răspunde la prima întrebare, să ne gândim din nou la structura ADN-ului. A fost imediat evident că secvența unidimensională a unei polipeptide poate fi codificată în secvența unidimensională a lanțurilor polinucleotidice dintr-o moleculă de ADN231. Adevărata întrebare a fost cum să traducem limbajul acizilor nucleici, care constă în secvențe de patru baze nucleotidice diferite, în limbajul polipeptidelor, care constă în secvențe de 20 (sau 22) de aminoacizi diferiți. După cum a subliniat fizicianul George Gamow (1904-1968)232 , setul minim de nucleotide necesar pentru a codifica toți cei 20 de aminoacizi este de trei; o secvență de o nucleotidă (41) ar putea codifica cel mult patru animoacizi diferiți, o secvență de două nucleotide ar putea codifica (42) sau 16 aminoacizi diferiți (insuficient), în timp ce o secvență de trei nucleotide (43) ar putea codifica 64 de aminoacizi diferiți (mai mult decât suficient)233 . Deși schema reală de codificare propusă de Gamow a fost greșită, gândirea sa despre capacitatea de codificare a ADN-ului i-a influențat pe cei care și-au propus să determine experimental regulile reale ale „codului genetic”.
Codul genetic nu este informația în sine, ci algoritmul prin care secvențele de nucleotide sunt „citite” pentru a determina secvențele polipeptidice. O polipeptidă este codificată de secvența de nucleotide. Această secvență de nucleotide este citită în grupuri de trei nucleotide, cunoscute sub numele de codon. Codonii sunt citiți într-un mod care nu se suprapun, fără spații (adică nucleotide necodificatoare) între ei. Deoarece există 64 de codoni posibili, dar numai 20 (sau 22 – a se vedea mai sus) de aminoacizi diferiți utilizați în organisme, codul este redundant, adică anumiți aminoacizi sunt codificați de mai mult de un codon. În plus, există trei codoni, UAA, UAG și UGA, care nu codifică nici un aminoacid, dar sunt folosiți pentru a marca sfârșitul unei polipeptide, ei codifică „stopuri” sau perioade.
Regiunea de acid nucleic care codifică o polipeptidă începe cu ceea ce este cunoscut sub numele de codon „start” și continuă până când se ajunge la unul dintre cei trei codoni stop. O secvență definită de codoni de început și de oprire în cadru (cu un anumit număr de codoni între ei) este cunoscută sub numele de cadru de lectură deschis sau ORF. În acest punct este important să subliniem în mod explicit că, deși informația care codifică o polipeptidă este prezentă în ADN, această informație nu este utilizată direct pentru a specifica secvența polipeptidică. Mai degrabă, procesul este indirect. Informațiile din ADN sunt mai întâi copiate într-o moleculă de ARN (cunoscută sub numele de ARN mesager) și această moleculă de ARN este cea care dirijează sinteza polipeptidelor. Procesul de utilizare a informațiilor din ADN pentru a direcționa sinteza unei molecule de ARN este cunoscut sub numele de transcripție, deoarece atât ADN-ul, cât și ARN-ul utilizează același limbaj, secvențe de nucleotide. În schimb, polipeptidele sunt scrise într-un limbaj diferit, secvențe de aminoacizi. Din acest motiv, procesul de sinteză polipeptidică dirijată de ARN este cunoscut sub numele de traducere.
Contribuitori și atribuții
-
Michael W. Klymkowsky (University of Colorado Boulder) și Melanie M. Cooper (Michigan State University) cu contribuții semnificative din partea Eminei Begovic & o parte din asistența editorială a Rebeccăi Klymkowsky.