Uma célula bacteriana sintetiza milhares de diferentes polipeptídeos. A sequência destes polipeptídeos (os aminoácidos exatos do N- ao C-terminal) é codificada dentro do DNA do organismo. O genoma da maioria das bactérias é uma molécula de DNA circular de dupla cadeia que é de milhões de pares de bases de comprimento. Cada polipéptido é codificado por uma região específica desta molécula de ADN. Assim, nossas perguntas são como são reconhecidas regiões específicas no DNA e como a informação presente na sequência de ácidos nucléicos é traduzida em seqüência de polipeptídeos.
Para abordar a primeira pergunta, vamos pensar de volta à estrutura do DNA. Era imediatamente óbvio que a sequência unidimensional de um polipeptídeo poderia ser codificada na sequência unidimensional das cadeias de polinucleótidos em uma molécula de DNA231. A pergunta real era como traduzir a linguagem de ácidos nucléicos, que consiste em seqüências de quatro bases de nucleotídeos diferentes, na linguagem de polipéptidos, que consiste em seqüências dos 20 (ou 22) aminoácidos diferentes. Como apontado pelo físico George Gamow (1904-1968)232 o conjunto mínimo de nucleotídeos precisou codificar todos os 20 aminoácidos é três; uma seqüência de um nucleotídeo (41) poderia codificar no máximo quatro animoácidos diferentes, uma seqüência dois nucleotídeos em comprimento poderia codificar (42) ou 16 aminoácidos diferentes (não bastante), enquanto uma seqüência de três nucleotídeos (43) poderia codificar 64 aminoácidos diferentes (mais que bastante)233. Embora o esquema de codificação real que Gamow propôs estivesse errado, seu pensamento sobre a capacidade de codificação do DNA influenciou aqueles que se propuseram a determinar experimentalmente as regras reais do “código genético”.
O código genético não é a informação em si, mas o algoritmo pelo qual as seqüências de nucleotídeos são “lidas” para determinar seqüências de polipeptídeos. Um polipeptídio é codificado pela seqüência de nucleotídeos. Esta sequência de nucleotídeos é lida em grupos de três nucleotídeos, conhecidos como um códon. Os códons são lidos de forma não sobreposta, sem espaços (ou seja, nucleotídeos não codificadores) entre eles. Como existem 64 códons possíveis, mas apenas 20 (ou 22 – ver acima) aminoácidos diferentes utilizados em organismos, o código é redundante, ou seja, certos aminoácidos são codificados por mais de um códon. Além disso há três códons, UAA, UAG e UGA, que não codificam nenhum aminoácido mas são usados para marcar o fim de um polipeptídio, eles codificam “pára” ou períodos.
A região do ácido nucleico que codifica um polipeptídio começa com o que é conhecido como o códon “início” e continua até que um dos três códons de parada é alcançado. Uma sequência definida pelos códões de início e paragem (com algum número de códões entre eles) é conhecida como um quadro de leitura aberto ou um ORF. Neste ponto é importante apontar explicitamente, enquanto a informação que codifica um polipeptídeo está presente no DNA, esta informação não é utilizada directamente para especificar a sequência de polipeptídeos. Ao invés disso, o processo é indireto. A informação no DNA é a primeira cópia em uma molécula de RNA (conhecida como RNA mensageiro) e é esta molécula de RNA que direciona a síntese do polipeptídeo. O processo de usar a informação dentro do DNA para dirigir a síntese de uma molécula de RNA é conhecido como transcrição porque ambos DNA e RNA usam a mesma linguagem, seqüências de nucleotídeos. Em contraste, os polipeptídeos são escritos em uma linguagem diferente, seqüências de aminoácidos. Por esta razão o processo de síntese de polipeptídeos RNA é conhecido como tradução.
Contribuidores e Atribuições
-
Michael W. Klymkowsky (University of Colorado Boulder) e Melanie M. Cooper (Michigan State University) com contribuições significativas de Emina Begovic & alguma assistência editorial de Rebecca Klymkowsky.