Quelques notions sur le code génétique et les codons

Le code génétique a été élucidé au cours des années 1960-1965.

Le code génétique est universel : il est le même dans tous les organismes aussi bien chez les eucaryotes que chez les procaryotes. Il existe des exceptions en particulier en ce qui concerne l'ADN des mitochondries humaines.

Il correspond à un ensemble d'entités structurales nucléotidiques appelés codons. Le codon génétique correspond à l'enchaînement ordonné de 3 bases nucléotidiques (ou triplet) permettant de définir le code d'un acide aminé.

 

Il existe 4 nucléotides dans l'ARN messager : U, C, A et G. Il y a donc 43 = 64 codons différents pour définir l'ensemble des 20 acides aminés utilisés dans la synthèse des protéines. Le code génétique est dit redondant ou dégénéré.

Le codon AUG code pour une méthionine : ce codon initie la traduction de toutes les chaînes polypeptidiques. Il code aussi toute méthionine interne à la chaîne polypeptidique.

Trois codons (UAA, UAG, UGA) sont des codons qui ne peuvent pas être traduits en acides aminés : ce sont des codons appelés non sens ou STOP. Leur rôle est d'arréter la traduction.

nombre de codons
1
2
3
4
6
acide aminé
Met & initiation - Trp
Lys - Asn - Gln - His - Glu - Asp - Tyr - Cys - Phe
Ile - STOP
Thr - Pro - Ala - Gly - Val
Arg - Ser - Leu

 

Résultats du séquençage du génome humain.

Source : HGP - Nature 409, 860 - 921

Pour chacun des 64 codons, sont montrés sur la figure ci-contre :

  • l'acide aminé correspondant
  • la fréquence observée du codon considéré pour 10.000 codons employés
  • le codon
  • lignes noires : la prédiction d'appariement à l'anticodon porté par l'ARN de transfert (règle du "wobble", variabilité du 3è nucléotide du codon)
  • une séquence non modifiée de l'anticodon
  • le nombre de gènes codant pour l'ARN de transfert trouvés pour cet anticodon

Exemple de la phénylalanine :

  • la fréquence de codage de cet acide aminé par les codons UUU et UUC est respectivement de 171 et de 203 pour 10.000 codons
  • les 2 codons semblent décodés par un unique anticodon GAA qui utilise une règle du "wobble" G/U
  • 14 gènes codant pour l'ARN de transfert ont été trouvés pour cet anticodon GAA

 

1ère position
2ème position
3ème position
U
C
A
G
U
UUU
phenylalanine
UCU
sérine
UAU
tyrosine
UGU
cystéine
U
UUC
UCC
UAC
UGC
C
UUA
leucine
UCA
UAA

STOP

UGA

STOP

A
UUG
UCG
UAG
UGG
tryptophane
G
C
CUU
CCU
proline
CAU
histidine
CGU
arginine
U
CUC
CCC
CAC
CGC
C
CUA
CCA
CAA
glutamine
CGA
A
CUG
CCG
CAG
CGG
G
A
AUU
isoleucine
ACU
thréonine
AAU
asparagine
AGU
sérine
U
AUC
ACC
AAC
AGC
C
AUA
ACA
AAA
lysine
AGA
arginine
A
AUG

méthionine

codon initiation

ACG
AAG
AGG
G
G
GUU
valine
GCU
alanine
GAU
aspartate
GGU
glycine
U
GUC
GCC
GAC
GGC
C
GUA
GCA
GAA
glutamate
GGA
A
GUG
GCG
GAG
GGG
G

 

La phase ouverte de lecture ou cadre ouvert de lecture ("Open Reading Frame - ORF") est une séquence du brin d'ADN transcrit en ARN qui commence par le triplet ATG (ADN) correspondant au codon d'initiation de la traduction (AUG pour l'ARN) et se termine par l'un des 3 triplets TAA, TAG ou TGA (ADN) correspondant aux 3 codons de terminaison de la traduction (UAA, UAG ou UGA pour l'ARN).

La séquence du brin de l'ADN transcrit en ARN étant lue par triplets, il y a 3 phases de lecture possibles, avec un décalage de 1 nucléotide pour passer d'une phase à une autre.