Una célula bacteriana sintetiza miles de polipéptidos diferentes. La secuencia de estos polipéptidos (los aminoácidos exactos de N- a C-terminal) está codificada dentro del ADN del organismo. El genoma de la mayoría de las bacterias es una molécula de ADN circular de doble cadena que tiene millones de pares de bases. Cada polipéptido está codificado por una región específica de esta molécula de ADN. Así pues, nuestras preguntas son cómo se reconocen las regiones específicas del ADN y cómo se traduce la información presente en la secuencia del ácido nucleico en la secuencia del polipéptido.
Para abordar la primera pregunta, recordemos la estructura del ADN. Fue inmediatamente obvio que la secuencia unidimensional de un polipéptido podía ser codificada en la secuencia unidimensional de las cadenas de polinucleótidos en una molécula de ADN231. La verdadera cuestión era cómo traducir el lenguaje de los ácidos nucleicos, que consiste en secuencias de cuatro bases nucleotídicas diferentes, al lenguaje de los polipéptidos, que consiste en secuencias de los 20 (o 22) aminoácidos diferentes. Como señaló el físico George Gamow (1904-1968)232 el conjunto mínimo de nucleótidos necesario para codificar los 20 aminoácidos es de tres; una secuencia de un nucleótido (41) podría codificar como máximo cuatro animoácidos diferentes, una secuencia de dos nucleótidos de longitud podría codificar (42) o 16 aminoácidos diferentes (no es suficiente), mientras que una secuencia de tres nucleótidos (43) podría codificar 64 aminoácidos diferentes (más que suficiente)233. Aunque el esquema de codificación real que Gamow propuso era erróneo, su pensamiento sobre la capacidad de codificación del ADN influyó en quienes se propusieron determinar experimentalmente las reglas reales del «código genético».
El código genético no es la información en sí, sino el algoritmo por el que se «leen» las secuencias de nucleótidos para determinar las secuencias de polipéptidos. Un polipéptido está codificado por la secuencia de nucleótidos. Esta secuencia de nucleótidos se lee en grupos de tres nucleótidos, conocidos como codones. Los codones se leen de forma no superpuesta, sin espacios (es decir, nucleótidos no codificantes) entre ellos. Dado que hay 64 codones posibles pero sólo 20 (o 22 – véase más arriba) aminoácidos diferentes utilizados en los organismos, el código es redundante, es decir, ciertos aminoácidos están codificados por más de un codón. Además, hay tres codones, UAA, UAG y UGA, que no codifican ningún aminoácido pero se utilizan para marcar el final de un polipéptido, codifican «paradas» o puntos.
La región del ácido nucleico que codifica un polipéptido comienza con lo que se conoce como el codón de «inicio» y continúa hasta que se alcanza uno de los tres codones de parada. Una secuencia definida por codones de inicio y de parada dentro del marco (con un cierto número de codones entre ellos) se conoce como marco de lectura abierto o ORF. En este punto es importante señalar explícitamente que, aunque la información que codifica un polipéptido está presente en el ADN, esta información no se utiliza directamente para especificar la secuencia del polipéptido. El proceso es más bien indirecto. La información del ADN se copia primero en una molécula de ARN (conocida como ARN mensajero) y es esta molécula de ARN la que dirige la síntesis del polipéptido. El proceso de utilizar la información del ADN para dirigir la síntesis de una molécula de ARN se conoce como transcripción porque tanto el ADN como el ARN utilizan el mismo lenguaje, las secuencias de nucleótidos. En cambio, los polipéptidos están escritos en un lenguaje diferente, las secuencias de aminoácidos. Por esta razón, el proceso de síntesis de polipéptidos dirigido por el ARN se conoce como traducción.
Contribuidores y atribuciones
-
Michael W. Klymkowsky (Universidad de Colorado Boulder) y Melanie M. Cooper (Universidad Estatal de Michigan) con importantes contribuciones de Emina Begovic &alguna ayuda editorial de Rebecca Klymkowsky.