|
|
Les structures secondaires des protéines |
|
1. Introduction 2. Les hélices
3. Les feuillets
|
4. Les structures secondaires mixtes
5. Tours et boucles 6. Les méthodes de prédiction de structures secondaires 7. Liens Internet et références bibliographiques |
|
1. Introduction En 1953, la structure en double hélice de l'ADN a été résolue par F. Crick , J. Watson et M. Wilkins (Prix Nobel 1962). L'information dans l'ADN est sous forme linéaire. En conséquence, les molécules d'ADN ont une structure semblable. En revanche, chacune des milliers de protéines qui existent dans la cellule doit reconnaitre spécifiquement un (ou quelques) ligand(s). Cette reconnaissance s'effectue grâce à de subtiles interactions entre la structure tridimensionnelle de la protéine et celle(s) du (des) ligand(s). Une telle diversité d'interactions aussi précises ne peut être obtenue qu'avec des structures de protéines extrêmement variées et irrégulières. Au sein de la structure tridimensionnelle des protéines, il existe cependant des "sous"-structures aux caractéristiques régulières : les structures secondaires. |
| Voir les définitions de toutes les structures secondaires recencées : base de données CATH (glossaire) |
| 2. Les hélices |
Visualisation du répresseur ROP de Escherichia coli à une résolution de 1,7 Å Code PDB : 1ROP Pour faire apparaître de multiples fonctions du menu Jmol :
|
|
Hélice 310 :
Hélice π :
|
| 3. Les feuillets |
|
3a. Structures β antiparallèles Les structures β antiparallèles forment le 2ème grand groupe de domaines de protéines. C'est aussi le plus diversifié puisqu'il comprend des enzymes, des protéines de transport, des anticorps, des protéines d'enveloppe de virus ...).
Les feuillets β ont une torsion classique et quand 2 de ces feuillets β sont assemblés, ils forment une structure en tonneau ("β barrel"). Voir l'exemple des porines. |
Visualisation de la superoxide dismutase de Bos taurus à une résolution de 1,85 Å Code PDB : 1E9O Pour faire apparaître de multiples fonctions du menu Jmol :
|
Récapitulatif Voir la méthode du diagramme de Ramachandran pour une définition des angles. |
| type de structure | valeurs des angles (degrés) | nombre moyen de résidus par tour |
translation par résidu (angstroem) |
||
| Φ | Ψ | ω | |||
| hélice α | - 57 | - 47 | 180 | 3,6 | 1,5 |
| hélice 310 | - 49 | - 26 | 180 | 3,0 | 2,0 |
| hélice π | - 57 | - 70 | 180 | 4,4 | 1,15 |
| hélice polyproline I | - 83 | + 158 | 0 | 3,38 | 1,9 |
| hélice polyproline II | - 78 | + 149 | 180 | 3,0 | 3,12 |
| brin β parallèle | - 119 | + 113 | 180 | 2,0 | 3,2 |
| brin β antiparallèle | - 139 | + 135 | - 178 | 2,0 | 3,4 |
| Source : base de données PROWL --> consulter l'item : "Residue hydrogen bonding" | |||||
|
4a. Les structures alpha/beta La structure de domaines de protéines la plus fréquente et la plus régulière est celle du domaine alpha/béta (α/β) constitué d'un feuilletβ central parallèle ou mixte entouré d'hélices α. Toutes les enzymes de la glycolyse ont ce type de structure. Dans ces domaines, les sites de liaison des ligands sont formés par des boucles de jonction. Celles-ci ne contribuent pas à la stabilité de la structure mais participent à la fléxibilité conformationnelle nécessaire pour les mouvements liés à l'activité catalytique (à la fixation des ligands de manière générale). |
Visualisation de la glyceraldehyde 3-phosphate déshydrogénase de Thermus Thermophilusà une résolution de 2,6 Å Code PDB : 1VC2 Pour faire apparaître de multiples fonctions du menu Jmol :
|
La glyceraldehyde 3-phosphate déshydrogénase est une enzyme de la glycolyse. Elle catalyse la seule réaction d'oxydo-réduction de cette voie métabolique. Elle utilise la nicotinamide adénine dinucléotide (NAD+). |
|
Tours C'est la structure qui connecte deux brins β antiparallèles. Les tours sont généralement courts : 2 à 4 acides aminés en dehors des brins. Les conformations possibles ont été classées selon les valeurs des angles Φ et Ψ des différents acides aminés. Le tableau ci-dessous donne les types les plus importants, 1 ou 2 acides aminés dans le tour. Le dernier acide aminé du premier brin est appelé i le premier acide aminé du second brin est appelé i+2. |
| Type de tours | sous - type | Φi+1 | Ψi+1 | Φi+2 | Ψi+2 |
| γ | classique | + 70 à + 85 | - 60 à - 70 | ||
| inverse | + 70 à + 85 | - 60 à - 70 | |||
| β | I | - 60 | - 30 | - 90 | 0 |
| I' | +60 | +30 | + 90 | 0 | |
| II | - 60 | + 120 | + 80 | 0 | |
| II' | + 60 | - 120 | - 80 | 0 | |
| D'autres sous-types (de II, II' jusqu'à VIII) ont été recensés. | |||||
|
Boucles Les structures des protéines sont souvent des combinaisons d'hélice et de feuillets reliées par des boucles de longueurs trés variables : de 1 à 12 résidus (voire jusqu'à 22) avec le plus fréquemment 1, 3, 4 ou 7 résidus. La comparaison de structures tridimensionnelles montre que les boucles adoptent un nombre limité de conformations. |
Source : "Introduction à la structure des protéines" (1996) Branden & Tooze - Ed. DeBoeck Université |
Elles participent donc à la formation :
Les boucles sont généralement à la surface des protéines. Les groupements C=O et NH (liaison peptidique) ne forment en général pas de liaisons hydrogène entre eux mais plutôt avec les molécules du solvant (l'eau). Les régions des boucles exposées au solvant sont riches en résidus hydrophiles, chargés ou polaires. Ce sont des régions privilégiées d'insertions ou de délétions entre séquences homologues. Par ailleurs, beaucoup d'introns au niveau des gènes correspondent à des boucles. Les boucles qui relient 2 brins β antiparallèles sont dites en "épingle à cheveux". Voir un exemple de structure hélice - boucle - hélice : le motif "EF-hand" de la calmoduline. |
|
6. Les méthodes de prédiction de structures secondaires La première d'entre elles, la méthode de prédiction de Chou et Fasman (1974-1978) est une méthode statistique. Des tables d'occurence des acides aminés dans les différents états structuraux ont été établies. Chou et Fasman ont observé les 29 structures 3D connues à cette époque (on en dénombre 79180 en Février 2012 !) et ils ont affecté chaque acide aminé à un état structural : hélice, brin, apériodique ou coude. |
| Nom | Nombre | hélice | feuillet | apériodique | coude |
| Arg | 142 | 53 | 26 | 63 | 40 |
| Cys | 94 | 25 | 22 | 47 | 33 |
| Gln | 162 | 68 | 35 | 59 | 47 |
| Tyr | 184 | 48 | 53 | 83 | 62 |
| Val | 357 | 144 | 119 | 94 | 53 |
| Total | 4741 | 1798 | 930 | 2013 | 1400 |
| Source : G. Deleage | |||||
Nom P(α) P(β) P(turn) Alanine 142 83 66 Arginine 98 93 95 Aspartic Acid 101 54 146 Asparagine 67 89 156 Cysteine 70 119 119 Glutamic Acid 151 037 74 Glutamine 111 110 98 Glycine 57 75 156 Histidine 100 87 95 Isoleucine 108 160 47 Leucine 121 130 59 Lysine 114 74 101 Methionine 145 105 60 Phenylalanine 113 138 60 Proline 57 55 152 Serine 77 75 143 Threonine 83 119 96 Tryptophan 108 137 96 Tyrosine 69 147 114 Valine 106 170 50 |
Sur la base de cette table, Chou
et Fasman ont établit la table
des paramètres conformationnels Pα, Pβ et P(coude) en calculant les rapports des
fréquences.
Exemple pour Tyr : Pβ (Tyr) = [(53 / 184) / (930 / 4741)] = 147. Source : algorithme décrit à la base de données PROWL. |
| Il existe maintenant un trés grand nombre de méthodes de prédiction dont la plupart sont répertoriés à EXPASY ("ExPASy Proteomics tools"). A partir des outils du site EXPASY, s'exercer à la prédiction de structures secondaires avec la séquence de la protéine LEA ("Late Embryogenesis Abundant") de Arabidopsis thaliana: >1YYCA ghhhhhhleasadekvveekasvisslldkakgffaeklaniptpeatvddvdfkgvtrdgvdyhakvsv knpysqsipicqisyilksatrtiasgtipdpgslvgsgttvldvpvkvaysiavslmkdmctdwdidyq ldigltfdipvvgditipvstqgeiklpslrdff Exemple de logiciel "GOR" (Garnier et al, 1996) - faire un copier / coller de la séquence sans le n° d'accession. Voir la structure 3D de cette protéine LEA : PDB 1YYC (activer "Jmol"). |
Aller au site : "FirstGlance in Jmol". Dans la fenêtre, taper 1d66 puis "Submit". Cette figure permet de visualiser le motif dit en "doigt de zinc" à 6 cystéines ("C6 zinc finger") : CX2CX6CX5-6CX2CX6C. |
L'archétype est le facteur de transcription GAL4 de la levure qui forme un dimère lors de son interaction avec l'ADN via son domaine N-terminal. GAL4 active la transcription des gènes nécessaires à l'utilisation du galactose par la levure (UASG "upstream activated sequence for the yeast Gal genes"). |
Source : EMBO reports 7 |
Il existe des "calculateurs" de propriétés physico-chimiques des protéines. Ils s'appuient sur des masses de données colossales donc ont une bonne signification statistique. Exemple Composition Profiler : "A web-based tool that automates detection of enrichment or depletion patterns of individual amino acids or groups of amino acids classified by several physico-chemical and structural properties such as aromaticity, charge, polarity, hydrophobicity, flexibility, surface exposure, solvation potential, interface propensity, normalized frequency of occurrence in helices, structures, and coils, linker and disorder propensities, size and bulkiness." |
Residue SwissProt PDB S25 Surface DisProt Ala (A) 7.89 ± 0.05 7.70 ± 0.08 6.03 ± 0.13 8.10 ± 0.35 Arg (R) 5.40 ± 0.04 4.93 ± 0.06 6.56 ± 0.13 4.82 ± 0.23 Asn (N) 4.13 ± 0.04 4.58 ± 0.06 6.23 ± 0.15 3.82 ± 0.27 Asp (D) 5.35 ± 0.03 5.83 ± 0.05 8.18 ± 0.10 5.80 ± 0.30 Cys (C) 1.50 ± 0.02 1.74 ± 0.05 0.78 ± 0.04 0.80 ± 0.08 Gln (Q) 3.95 ± 0.03 3.95 ± 0.05 5.21 ± 0.09 5.27 ± 0.37 Glu (E) 6.67 ± 0.04 6.65 ± 0.07 8.70 ± 0.17 9.89 ± 0.61 Gly (G) 6.96 ± 0.04 7.16 ± 0.07 7.06 ± 0.11 7.41 ± 0.40 His (H) 2.29 ± 0.02 2.41 ± 0.04 2.60 ± 0.06 1.93 ± 0.11 Ile (I) 5.90 ± 0.04 5.61 ± 0.06 2.77 ± 0.07 3.24 ± 0.13 Leu (L) 9.65 ± 0.04 8.68 ± 0.08 5.11 ± 0.08 6.22 ± 0.25 Lys (K) 5.92 ± 0.05 6.37 ± 0.08 9.75 ± 0.16 7.85 ± 0.45 Met (M) 2.38 ± 0.02 2.22 ± 0.04 1.13 ± 0.04 1.87 ± 0.10 Phe (F) 3.96 ± 0.03 3.98 ± 0.04 2.38 ± 0.05 2.44 ± 0.13 Pro (P) 4.83 ± 0.03 4.57 ± 0.05 5.63 ± 0.10 8.11 ± 0.63 Ser (S) 6.83 ± 0.04 6.19 ± 0.06 6.87 ± 0.13 8.65 ± 0.43 Thr (T) 5.41 ± 0.02 5.63 ± 0.05 6.08 ± 0.11 5.56 ± 0.24 Trp (W) 1.13 ± 0.01 1.44 ± 0.03 1.33 ± 0.05 0.67 ± 0.06 Tyr (Y) 3.03 ± 0.02 3.50 ± 0.04 3.58 ± 0.08 2.13 ± 0.15 Val (V) 6.73 ± 0.03 6.72 ± 0.06 4.01 ± 0.06 5.41 ± 0.44 Sources :
DisProt est une base de données dédiée aux protéines intrinsèquement non structurées. |
| 7. Liens Internet et références bibliographiques |
| "Introduction à la structure des protéines" (1996) Branden & Tooze - Ed. DeBoeck Université | |
|
Cours 1 : "Secondary structure and backbone conformation" (Cours "SwissProt") Cours 2 : "Super-secondary structure" (Cours "SwissProt") Cours 3 : "Tertiary Protein Structure and folds" (Cours "SwissProt") |
|
| "Secondary structure of Proteins" | aller au site |
| Base de données PROWL : propriétés physico - chimiques des acides aminés, peptides, protéines. | PROWL |
Les méthodes de prédiction de structures secondaires Chou & Fasman (1974) "Conformational parameters for amino acids in helical, beta-sheet, and random coil regions calculated from proteins" Biochemistry 13, 211 - 222 Chou & Fasman (1978) "Prediction of the secondary structure of proteins from their amino acid sequence" Adv. Enzymol. Relat. Areas Mol. Biol. 47, 45 - 147 Garnier et al. (1996) "GOR secondary structure prediction method version IV" Methods in Enzymology R.F. Doolittle Ed., vol 266, 540 - 553 Chen et al. (2006) "Improved Chou-Fasman method for protein secondary structure prediction" BMC Bioinformatics 7, S14 Zheng C & Lukasz K (2008) "Prediction of beta-turns at over 80% accuracy based on an ensemble of predicted secondary structures and multiple alignments" BMC Bioinformatics 9, 430 |
|
Dodd & Egan (1990) "Improved detection of helix-turn-helix DNA-binding motifs in protein sequences" Nucleic Acids Res 18, 5019 - 5026 Pellegrini-Calace & Thornton (2005) "Detecting DNA-binding helix - turn - helix structural motifs using sequence and structure information" Nucleic Acids Res 33, 2129 - 2140 Vacic et al. (2007) "Composition Profiler: A tool for discovery and visualization of amino acid composition differences" BMC Bioinformatics 8, 211 |
|