|
|
Les acides aminés et la structure primaire des protéines |
|
1. Structure générale et stéréochimie des acides aminés 2. Structure des chaînes latérales 3. Nature et caractéristiques des chaînes latérales 4. Propriétés physico-chimiques des acides aminés 5. La structure primaire ou séquence primaire ou enchaînement des acides aminés ou chaîne polypeptidique
|
6. Acides aminés et protéines intrinsèquement désordonnées 7. Expériences pour l'étude de la structure primaire de l'hirudine 8. Liens Internet et références bibliographiques |
| 1. Structure générale et stéréochimie des acides aminés |
|
A l'exception de la glycine (Gly), tous les acides aminés possèdent un carbone α asymétrique (ou chiral). Il existe donc pour chacun d'entre eux deux isomères stéréochimiques, images en miroir, appelés énantiomères (figure ci-contre). La convention pour définir la stéréochimie du carbone a s'appuie sur celle des énantiomères du glycéraldehyde. A quelques rares exceptions près, les acides aminés constitutifs des protéines sont tous de configuration L. Dans la cellule (pH neutre), le groupe α-carboxyle et le groupe α-aminé sont ionisés :
Les acides aminés sont des ions amphotères (ou zwiterrions). |
|
|
2 cas particuliers :
|
| 3. Nature et caractéristiques des chaînes latérales |
| Acide aminé |
code |
Nature de la chaîne latérale | Caractéristiques | pKa ionisation |
| alanine (Ala) | A |
aliphatique (hydrocarbure saturé) Ala : groupe méthyle Val, Leu & Ile : chaîne ramifiée |
Ile contient 2 carbones asymétriques (4 stéréoisomères) | --------- |
| valine (Val) |
V |
|||
| leucine (Leu) | L | |||
| isoleucine (Ile) | I | |||
| proline (Pro) | P |
acide α-Iminé (groupe aminé secondaire) chaîne latérale liée à la fois au groupe α-carboxyle ET au groupe α-aminé |
structure particulière qui impose des changements de direction de l'enchaînement des carbones α des chaines polypeptidiques |
--------- |
| phénylalanine (Phe) | F |
groupe aromatique Phe : groupe phényl Trp : noyau indole Tyr : groupe phénol |
absorbent la lumière UV (ce qui permet de mesurer la concentration d'une protéine en solution) Phe : λ = 260 nm / Trp : λ = 278 nm Tyr à pH 7 : λ = 273 - 277 nm Tyr à pH 13 (ion phénolate) : λ = 293 - 297 nm |
--------- |
| tryptophane (Trp) | W | --------- | ||
| tyrosine (Tyr) | Y | 10,5 | ||
| méthionine (Met) | M | groupe méthylthioester | Met et Cys sont des mercaptans | --------- |
| cystéine (Cys) | C | groupe thiol | peut former un pont disulfure avec une autre cystéine | 8,4 |
| glycine (Gly) | G | atome d'hydrogène | seul acide aminé non chiral et le plus petit | --------- |
| aspartate (Asp) | D | groupe carboxyle |
souvent à la surface des protéines où ils établissent des liaisons hydrogène ou des ponts salins (solvant ou autres molécules) |
3,9 |
| glutamate (Glu) | E | 4,1 | ||
| asparagine (Asn) | N | amides respective de Asp et Glu |
trés polaires souvent à la surface des protéines (liaisons hydrogène) |
|
| glutamine (Gln) | Q | |||
| sérine (Ser) | S |
alcool aliphatique groupe β - hydroxyle |
réactif au sein des protéines, exemple : protéases à sérine | non mesurable en solution aqueuse |
| thréonine (Thr) | T | 2 carbones asymétriques (4 stéréoisomères) | --------- | |
| lysine (Lys) | K |
bases azotées Lys : groupe ε - aminé Arg : ion guanidinium His : noyau imidazole |
souvent à la surface des protéines où ils établissent des liaisons hydrogène ou des ponts salins (solvant ou autres molécules |
10,5 |
| arginine (Arg) | R | 12 | ||
| histidine (His) | H |
réactif au sein des protéines, exemple : protéases à sérine |
6,0 | |
Cas particuliers : Asx = Asp ou Asn - B (voir "Hydrolyse totale de protéines") / Glx = Glu ou Gln - Z / N'importe quel acide aminé = Xaa - X |
||||
| Voir le cours sur le métabolisme des acides aminés | ||||
|
Outre les 20 acides aminés les plus fréquemment utilisés pour la synthèse des protéines, 319 autres acides aminés ont été recencés dans les protéines. En voici quelques exemples : |
| acide aminé | protéine |
| N-formyl-L-méthionine | méthionine-tRNA ligase (EC 6.1.1.10) methionyl-tRNA formyltransférase (EC 2.1.2.9) |
| 3-hydroxy-L-proline | procollagène-proline 3-dioxygénase (EC 1.14.11.7) |
| L-cysteinyl molybdoptérine | métalloprotéine à molybdene - phosphoprotéine |
| N-palmitoyl-glycine | glycylpeptide N-palmitoyltransférase (EC 2.3.1.X) |
| L-lysine methyl ester | protéine-lysine O-méthyltransférase (EC 2.1.1.X) |
| O-(phosphoglycosyl-D-mannose-1-phosphoryl)-L-sérine | GDP-mannose:sérine-protéine mannose-1-phosphotransférase (EC 2.7.8.X) |
| phycoérythrobiline-bis-L-cystéine | phycoérythrobiline chromophore 1 |
| Source: ("RESID Database") | |
|
4. Propriétés physico-chimiques des acides aminés Les acides aminés ont des propriétés physico-chimiques trés diverses. La base de données " ProtScale" fournit près de 60 tables de valeurs de ces propriétés. En voici quelques exemples : (Source : " ProtScale")
|
5. La structure primaire ou séquence primaire ou enchaînement des acides aminés ou chaîne polypeptidique |
|
Les protéines sont des bioplolymères formés par la condensation des acides aminés. La liaison qui unit 2 acides aminés consécutifs s'appelle la liaison peptidique.
|
La liaison du carbone carbonyle avec l'azote dans la liaison peptidique (1,33 Å, non indiquée dans la figure) est plus courte que la liaison simple C-N mais plus longue qu'une liaison double C=N classique. Le caractère partiellement double de la liaison peptidique empêche la rotation autour de la liaison C-N. En conséquence, le groupe peptidique est confiné dans un plan. Il existe cependant une liberté de rotation autour des liaisons Cα-C et N-Cα.
|
||
|
On obtient ainsi un enchaînement d'acides aminés. C'est ce que l'on appelle la structure primaire ou séquence ou chaîne polypeptidique. La chaîne polypeptidique est toujours représentée depuis l'extrémité N-terminale (c'est-à-dire l'acide aminé qui a un groupe α-aminé libre) jusqu'à l'extrémité C-terminale (l'acide aminé qui a un groupe α-carboxyle libre). |
| b. Détermination de la séquence primaire à partir de l'extrémité N-terminale : la dégradation de Pehr Edman |
|
La fonction α-aminée de l'acide aminé en position N-terminale de la chaîne polypeptidique d'une protéine (ou d'un polypeptide) est traitée à pH alcalin par l'isothiocyanate de phényle (PITC), appelé aussi réactif d'Edman. On obtient un dérivé phénylthiocarbamyle (PTC) de la protéine ou du peptide. Ce dérivé est traité par un acide anhydre tel que l'acide trifluoroacétique. Source figures : "Principes de Biochimie" Horton et al. (1994), Ed. DeBoeck Universités |
La liaison peptidique liant l'acide aminé en position N-terminale est spécifiquement coupée. Le dérivé anilinothiazolinone de cet acide aminé est séparé du reste de la chaîne polypeptidique par extraction avec un solvant organique, le chlorure de butyle. On traite ce dérivé instable par une solution acide qui le transforme en dérivé stable : le phénylthiohydantoïne acide aminé (PTH - acide aminé).
Le PTH - acide aminé est séparé, quantifié et identifié par chromatographie en phase reverse avec une phase stationnaire sur laquelle est greffée une chaîne alkylée en C18 (octadécyl) ; Le reste de la chaîne polypeptidique subit de nouveau l'ensemble du traitement et les acides aminés sont ainsi séquencés tour à tour à partir de l'extrémité N-terminale. |
| c. Détermination de la séquence primaire à partir de l'extrémité C-terminale : carboxypeptidase |
La séquence en position C-terminale d'une protéine est obtenue par action de la carboxypeptidase Y :
La vitesse de libération des acides aminés permet d'établir la séquence primaire. Dans le cas présent : Gln - Leu - Tyr - Glu - Glu |
|
d. Machine "artificielle" de synthèse peptidique Les ribosomes synthétisent les protéines en polymérisant (liaison peptidique) les acides aminés dans un ordre déterminé par les ARN messagers. Des chercheurs ont créé une "machine artificielle de synthèse peptidique" : elle se déplace le long d'un chapelet de molécules, ramasse les acides aminés qui bloquent sa trajectoire, afin de synthétiser un peptide selon une séquence spécifique. |
La structure chimique est basée sur un rotaxane, un anneau moléculaire enfilé sur un axe moléculaire. L'anneau porte un groupe thiolate qui enlève de manière itérative les acides aminés dans l'ordre codé par le brin et les transfère vers un site l'élongation du peptide par ligature chimique. |
Source : Lewandowski et al. (2013) |
La synthèse est obtenue avec 1018 "machines moléculaires" agissant en parallèle. Le processus génère des quantités de peptide de l'ordre du milligramme avec une séquence unique confirmée par spectrométrie de masse. |
On a recensé envron 460 propriétés physico-chimiques pour les acides aminés. Bon nombre d'entre elles sont "redondantes" ou en tout cas, il existe une forte corrélation entre elles. La charge nette d'une protéine est la propriété physico-chimique qui semble la plus discriminante pour déterminer son degré de désordre et donc s'il s'agit d'une IDP. Cela semble logique puisque plus la charge nette d'une protéine est importante plus les forces de répulsion électrosatiques le sont et plus la chaîne polypeptidique a tendance à être dépliée / désordonnée. Les études statistiques et bioinformatiques de trés grands jeux de données d'IDP (dis XRAY, dis NMR, dis CD, dis Fam32) ont permis de classer les acides aminés du "plus promoteur d'ordre" au "plus promoteur de désordre" : W, F, Y, I, M, L, V, N, C, T, A, G, R, D, H, Q, K, S, E, P |
Propriétés physico-chimiques les plus discriminantes Source : Dunker et al. (2001) |
Kyte & Doolittle (1982) "Amino acid scale: Hydropathicity" J. Mol. Biol. 157, 105 - 132 Eisenberg et al. (1984) "Amino acid scale: Normalized consensus hydrophobicity scale" J. Mol. Biol. 179, 125 - 142 ----------------------------------------------------------------- Bases de données qui recense les échelles de valeurs des propriétés physico-chimiques des acides aminés :
|
| Charge nette | |
| Nombre de contact dans un rayon de 14 Å | |
| Hydropathie - Echelle de Kyte & Doolittle (1982) | |
| Hydropathie - Echelle de Eisenberg et al. (1984) | |
| Flexibilité | |
| Propension à former des feuillets β | |
| Nombre de liaison de coordination | |
| Pourcentage des acides aminés promoteurs de désordre [R + E + S + P] | |
| Encombrement stérique ("bulkiness") | |
| Pourcentage des acides aminés promoteurs d'ordre [C + F + Y + W] | |
| Volume | |
| Réfractivité |
La composition en acides aminés de 4 jeux de données "protéines désordonnées" (dis XRAY, dis NMR, dis CD, dis Fam32) ont été comparés entre eux et avec un jeu de données "protéines ordonnées". La proportion de chaque acide aminé dans chacun des jeux de données a été exprimée par : [nombre de l'acide aminé considéré dans les protéines désordonnées) - (nombre de l'acide aminé considéré dans les protéines ordonnées)] / (nombre de l'acide aminé considéré dans les protéines ordonnées). Dans la figure ci-contre, un pic négatif signifie donc que le jeux de données "protéines désordonnées" considéré contient moins l'acide aminé considéré que le jeu de données "protéines ordonnées". |
Source : Dunker et al. (2001) |
Les acides aminés sont rangés en fonction de leur indice de fléxibilité corrigé par le facteur de température ("Debye-Waller factor" ou "B-factor") qui tient compte des mouvements dûs à la châleur sur l'atténuation de la diffraction des rayons X. Celà permet de tenir davantage compte de certains effets de l'environnement sur les acides aminés. L'acide aminé le moins flexible est à gauche (Trp) et le plus flexible est à droite (Lys). |
Si on représente la valeur absolue de la charge nette moyenne (c'est-à-dire pondérée par la longueur de la chaîne polypeptidique de l'IDP considérée) à pH 7 (<R>) en fonction de la valeur absolue de l'hydrophobicité moyenne (<H>), on obtient un graphique avec deux zones qui correspondent aux IDP et aux protéines structurées, respectivement. Ces zones sont délimitées par une droite d'équation : <H> = [ <R> + 1,151 ] / 2,785 et les IDP sont au dessus de cette ligne. On obtient un graphique équivalent si on représente <R> en fonction de la valeur absolue de l'hydropathie moyenne ("GRand Average of hYdropathy" - <GRAVY>). |
Source : Uversky et al. (2000) |
| 8. Liens Internet et références bibliographiques |
| Bases de données sur les acides aminés peu fréquents (sous-partie de la base de données "Protein Information Resource" - PIR) | |
|
Bases de données sur les propriétés physico-chimiques des acides aminés (sous-partie de la base de données "Expasy - Swiss-Prot") |
|
| Base de données PROWL : propriétés physico - chimiques des acides aminés, peptides, protéines. | |
Dunker et al. (2001) "Intrinsically disordered protein" J. Mol. Graph. Model 19, 26 - 59 Uversky et al. (2000) "Why are "natively unfolded" proteins unstructured under physiologic conditions ?" Proteins 41, 415 - 427 |
|
Jaspard et al. (2012) "Computational and Statistical Analyses of Amino Acid Usage and Physico-Chemical Properties of the Twelve Late Embryogenesis Abundant Protein Classes" PLoS ONE 7, e36968 Lewandowski et al. (2013) "Sequence-Specific Peptide Synthesis by an Artificial Small-Molecule Machine" Science 339, 189 - 193 |
|
| Pehr Edman (1950) Acta Chem. Scand. 4, 283 | |