Une cellule bactérienne synthétise des milliers de polypeptides différents. La séquence de ces polypeptides (les acides aminés exacts du N- au C-terminal) est codée dans l’ADN de l’organisme. Le génome de la plupart des bactéries est une molécule d’ADN circulaire à double brin qui compte des millions de paires de bases. Chaque polypeptide est codé par une région spécifique de cette molécule d’ADN. Nos questions sont donc les suivantes : comment les régions spécifiques de l’ADN sont-elles reconnues et comment l’information présente dans la séquence des acides nucléiques est-elle traduite en séquence polypeptidique.
Pour répondre à la première question, repensons à la structure de l’ADN. Il était immédiatement évident que la séquence unidimensionnelle d’un polypeptide pouvait être codée dans la séquence unidimensionnelle des chaînes polynucléotidiques d’une molécule d’ADN231. La véritable question était de savoir comment traduire le langage des acides nucléiques, qui consiste en des séquences de quatre bases nucléotidiques différentes, en langage des polypeptides, qui consiste en des séquences de 20 (ou 22) acides aminés différents. Comme l’a souligné le physicien George Gamow (1904-1968)232, l’ensemble minimal de nucléotides nécessaire pour coder les 20 acides aminés est de trois ; une séquence d’un nucléotide (41) pourrait coder au maximum quatre acides animés différents, une séquence de deux nucléotides pourrait coder (42) ou 16 acides aminés différents (pas assez), tandis qu’une séquence de trois nucléotides (43) pourrait coder 64 acides aminés différents (plus qu’assez)233. Bien que le schéma de codage réel que Gamow a proposé était erroné, sa réflexion sur la capacité de codage de l’ADN a influencé ceux qui ont entrepris de déterminer expérimentalement les règles réelles du « code génétique ».
Le code génétique n’est pas l’information elle-même, mais l’algorithme par lequel les séquences de nucléotides sont « lues » pour déterminer les séquences de polypeptides. Un polypeptide est codé par la séquence de nucléotides. Cette séquence de nucléotides est lue par groupes de trois nucléotides, appelés codons. Les codons sont lus de manière non chevauchante, sans espace (c’est-à-dire sans nucléotides non codants) entre eux. Comme il y a 64 codons possibles mais seulement 20 (ou 22 – voir ci-dessus) acides aminés différents utilisés dans les organismes, le code est redondant, c’est-à-dire que certains acides aminés sont codés par plus d’un codon. En outre, il existe trois codons, UAA, UAG et UGA, qui ne codent aucun acide aminé mais sont utilisés pour marquer la fin d’un polypeptide, ils codent des « arrêts » ou des périodes.
La région de l’acide nucléique qui code un polypeptide commence par ce qu’on appelle le codon « start » et se poursuit jusqu’à ce qu’un des trois codons stop soit atteint. Une séquence définie par des codons de départ et d’arrêt dans le cadre (avec un certain nombre de codons entre eux) est appelée cadre de lecture ouvert ou ORF. À ce stade, il est important de souligner explicitement que, bien que l’information codant pour un polypeptide soit présente dans l’ADN, cette information n’est pas utilisée directement pour spécifier la séquence polypeptidique. Le processus est plutôt indirect. L’information contenue dans l’ADN est d’abord copiée dans une molécule d’ARN (appelée ARN messager) et c’est cette molécule d’ARN qui dirige la synthèse du polypeptide. Le processus consistant à utiliser les informations contenues dans l’ADN pour diriger la synthèse d’une molécule d’ARN est appelé transcription, car l’ADN et l’ARN utilisent le même langage, à savoir les séquences de nucléotides. En revanche, les polypeptides sont écrits dans un langage différent, les séquences d’acides aminés. Pour cette raison, le processus de synthèse des polypeptides dirigé par l’ARN est connu sous le nom de traduction.
Contributeurs et attributions
-
Michael W. Klymkowsky (Université du Colorado Boulder) et Melanie M. Cooper (Université d’État du Michigan) avec des contributions importantes d’Emina Begovic &une certaine assistance éditoriale de Rebecca Klymkowsky.