|
|
Cystéine et pont disulfure Prédiction des cystéines impliquées dans un pont disulfure Relation structure - fonction des protéines |
|
1ère partie : cystéine et pont disulfure
|
The Disulfide Bridge DataBase (DBDB) is developped for the predictive analysis of cysteine residues involved in intra and inter disulfide bridges.
This database has been created by the GREBA. |
|
2ème partie : prédiction des cystéines impliquées dans un pont disulfure
|
|
|
| 1. La cystéine |
|
La cystéine est génétiquement codée par les 2 codons : UGU et UGC. La cystéine est l'acide L-2-amino-3-mercaptopropionique. La chaîne latérale de la cystéine porte un groupement sulfhydryle (-SH) extrêmement réactif. Son pKa est de 8.33. L'autre acide aminé sulfuré, la méthionine, porte un groupe méthyle supplémentaire. La méthionine est plus hydrophobe, d'un encombrement stérique plus important et moins réactive.
|
|
| 2. Formation d'un pont disulfure |
|
Un pont disulfure est une liaison covalente entre 2 atomes de soufre de la chaîne latérale de 2 résidus cystéines (Cys) réduits. Les ponts disulfure sont formés dans un environnement cellulaire oxydant. Le cytoplasme n'étant pas un milieu oxydant, il y a trés peu de protéines intracellulaires qui possèdent des ponts disulfure. Toutes les cystéines d'une protéine ne forment pas un pont disulfure :
Un pont disulfure peut être établi entre 2 cystéines :
Le nombre de ponts disulfure (intra et/ou inter) au sein des protéines varie trés grandement : les toxines, bien qu'étant de petites protéines (20 à 30 acides aminés) peuvent en contenir jusqu'à 5, voire 6. L'énergie libre de liaison qui résulte de la formation d'un pont disulfure est d'environ - 3,5 kcal/mol (voir Czaplewski et al., 2004). C'est une énergie importante qui contribue "sur le papier" de manière trés significative à la stabilisation de la structure tridimentionnelle native de la protéine. Cependant, les ponts disulfure ne jouent pas un rôle déterminant dans le repliement des protéines, puisque les intermédiaires adoptent des conformations transitoires qui peuvent être éloignées de celles qui mettent en jeu ces ponts disulfure. |
|
Nombre de ponts Exemple : quel est le nombre de combinaisons permettant de former 3 ponts disulfures à partir de 6 cystéines ?
|
De manière générale :
il existe [ (2n)! / 2nn! ] combinaisons. |
|
La distance entre les 2 carbones a de 2 résidus cystéine impliqués dans un pont disulfure est de 4.2 Å (Czaplewski et al., 2004) à 7.5 Å. L'entité structurale formé par 2 cystéines reliées par un pont disulfure s'appelle une cystine. La formation d'un pont disulfure est une réaction d'oxydo-réduction réversible : cette réversibilité dépend du potentiel rédox du milieu et du pH. |
|
|
![]() |
![]() |
|
|
b. La réaction de formation d'un pont disulfure Au cours de la réaction d'échange [thiol - disulfure], un anion thiolate R1S- déplace un soufre du pont disulfure R2-S-S-R3. |
![]() |
|
Dans l'état de transition, la charge négative du thiolate est délocalisée sur les 3 atomes de soufre. Les ponts disulfure sont formés et réduits au sein des protéines par 2 réactions d'échange [thiol - disulfure] avec un agent oxydo-réducteur tel que :
|
![]() |
![]() |
![]() |
La réaction d'échange
[thiol - disulfure] peut aussi avoir lieu au
sein d'une même protéine : un groupe thiolate d'une
protéine peut attaquer un pont disulfure de la même protéine,
conduisant à un remaniement
des ponts disulfure.
|
|
C'est un tripeptide formé de glycine, de cystéine et de glutamate. |
| Cependant, il a une particularité
: c'est le groupement carboxylique en position g
de la chaîne latérale du glutamate qui établit la
liaison peptidique avec la cystéine. C'est donc le g-glutamyl-cystéinyl-glycine
(structure ci-contre).
Le glutathion existe sous forme réduite ou oxydée. La forme oxydée correspond à l'association de 2 molécules de glutathion reliées par un pont disulfure (G-S-S-G). L'enzyme qui catalyse cette réaction est la glutathion réductase : G-S-S-G + NADPH + H+ <===> 2 G-SH + NADP+ |
|
|
L'une de ses fonctions biologiques est l'élimination de produits dérivés de l'oxygène qui sont hautement réactionnels et donc toxiques pour la cellule :
2 glutathion-SH + H-O-OH -----> glutathion-S-S-glutathion + 2 H2O |
|
d. Les protéines disulfide isomerases (PDI) et Ero1p Les protéines disulfide isomerases (EC 5.3.4.1) catalysent le ré-arrangement correct dans le réticulum endoplasmique des ponts disulfure des protéines néo-synthétisées. Ce sont des protéines à plusieurs domaines. |
|
Ci-contre, structure des domaines prolyl 4-hydroxylase (à droite) et B (à gauche) de la protéine disulfide isomerase de Homo sapiens - Kemmink et al. (1996 et 1999). Le site actif du domaine prolyl 4-hydroxylase de la PDI est constitué par les 2 cystéines C36GHC39 qui forment un pont disulfure. Codes accès : MMDB 5793 (hydroxylase) et 9693 (B) Codes accès : PDB 1MEK (hydroxylase) et 2BJX (B) |
|
![]() |
|
Pour oxyder les groupements thiols en disulfure des protéines cibles , les cystéines du site actif de la PDI doivent être maintenues dans l'état oxydé. Ero1p est une flavoenzyme associée à la membrane qui forment des ponts disulfure et les transfère à la PDI. Cette dernière peut alors oxyder les cystéines des protéines substrats. Le mécanisme de l'échange [thiol / disulfure] entre Ero1p et la PDI est le suivant : |
|
Source : Frand et al. (2000) |
|
Source : Gross et al. (2004) |
|
Ero1p contient :
|
|
3. Exemples |
|
On s'aperçoit que beaucoup de "petites" protéines (selon la classification SCOP - "Structural Classification of Proteins") possèdent des ponts disulfure. La bungarotoxine de venin de serpent est un antagoniste compétitif hautement sélectif et lentement réversible du récepteur nicotinique neuronal a3b2. La bungarotoxine est un homodimère (2 x 66 acides aminés). Chaque sous-unité contient 10 cystéines qui forment 5 ponts disulfure intra-chaînes ! R1TC3LISPSSTPQTC14PNGQDIC21FLKAQC27DKFC31SIRGPVIEQGC42VATC46PQFRSNYRSLLC58C59TTDNC64NH66
|
|
|
La mutagénèse dirigée a permis de montrer que :
|
|
|
En 1982, Rees & Lipscomb (J. Mol. Biol. 160, 475 Ð 498) ont découvert un nouveau type de repliement en déterminant la structure tridimensionnelle de l'inhibiteur de la carboxypeptidase. Ce type de repliement est le suivant : un pont disulfure pénètre dans un "macrocycle" formé par 2 autres ponts disulfure qui connectent des segments de la chaîne polypeptidique. Une telle structure évoque un "noeud" ou "knot" en anglais. Les membres de cette famille structurales sont ainsi appelés "knottin" ou "inhibitor cystine knots". A ce jour :
|
|
Ci-contre, représentation schématique du repliement des "knottins"
Source : Gelly et al. (2004) |
![]() |
|
Deux ponts disulfure INTER-chaînes de l'insuline se forment dès la biosynthèse de la pro-insuline. La chaîne C de la pro-insuline a pour rôle de positionner correctement les chaînes A et B. Quand la pro-insuline est correctement repliée, le peptide C est éliminé et un pont disulfure INTRA-chaîne se forme L'insuline adopte sa forme fonctionnelle. |
|
| Cette maturation par l'élimination du peptide C retarde l'apparition de l'activité hormonale de l'insuline jusqu'à ce qu'elle soit empaquetée dans les granules de sécrétion. |
![]() |
Ponts INTRA : CYS A 6 - CYS A 11 Ponts INTER : CYS A 7- CYS B 7 CYS A 20- CYS B 19 |
|
|
![]() |
![]() |
| d. Pont INTRA et INTER : les cathepsines |
|
Les cathepsines sont des protéases et il en existe différents types :
La cathepsine B (EC 3.4.22.1) est une thiol protéase : l'acide aminé du site actif responsable de l'acitivité catalytique est la cystéine 29. L'histidine 199 et une asparagine constituent les 2 autres acides aminés de la triade catalytique. Elle hydrolyse préférentiellement la liaison [Arg-Arg-X] et possède aussi une activité peptidyl-dipeptidase qui libère des dipeptides C-terminaux. La cathepsine B est synthétisée sous la forme d'un précurseur de 339 acides aminés avec un peptide signal (acides aminés 1 à 17). Elles est activée sous la forme d'une chaîne légère (acides aminés 80 à 126 du précurseur) et d'une chaîne lourde (acides aminés 129 à 333). La forme mature est un dimère (1 chaîne légère et 1 chaîne lourde) qui contient 6 ponts disulfure :
|
|
4. Fixation des métaux lourds par les métallothionines Les métallothionines sont des protéines de 60 à 68 acides aminés dont 20 cystéines ! Elles constituent une super famille de protéines qui contient 15 sous-familles (animaux, plantes et procaryotes). Elles fixent les métaux lourds tels que le cuivre, le zinc, le cadmium et le mercure. Quand le métal se fixe au groupe sulfhydryle, les ponts disulfure sont rompus et la protéine perd sa structure, la rendant ainsi non fonctionnelle. Les métallothionines contiennent 2 domaines de fixation du métal. Cette fixation se fait via les cystéines de chaque domaine. |
|
Structure des domaines alpha (à gauche) et beta (à droite) de la métallothionine 2 complexée au cadmium de Homo sapiens - Braun et al. (1990)
Les métallothionines ne contiennent pas de pont disulfure. |
![]() |
|
||||||||||||
|
Codes accès : MMDB 1673 (alpha) et 2810 (beta) Codes accès : PDB 1MHU (alpha) et 2MHU (beta) |
||||||||||||||
|
Les métallothionines jouent également un rôle protecteur vis-à-vis des espèces oxygénées réactives qui comportent des radicaux libres. L'albumine, la transferrine, la ceruloplasmine, la myoglobine et la ferritine font partie de ce groupe d'antioxidants protéiques. |
|
2ème partie : prédiction des cystéines impliquées dans un pont disulfure |
| 5. Description de la problématique |
|
a. Séquence en acides aminés et structure tridimensionnelle de la bungarotoxine [Oswald et al. (1997) - Code accès : MMDB 7358 - Code accès : PDB 2NBT] |
|
R1TC3LISPSSTPQTC14PNGQDIC21FLKAQC27DKFC31SIRGPVIEQGC42VATC46PQFRSNYRSLLC58C59TTDNC64NH66 |
![]() |
|
|
Conclusion : la répartition des cystéines dans la séquence en acides aminés et la répartition spatiale des ponts disulfure ne sont pas corrélés de manière évidente ! On remarque 2 cystéines contigües (C58 et C59) impliquées dans 2 ponts distincts. |
|
b. Un trés grand nombre de configurations des ponts disulfure Il existe un trés grand nombre nombre d'agencement des ponts disulfure les uns par rapport aux autres au sein des protéines. Lenffer et al. (2004) qui ont développé le programme (et le recueil de données) "CysView" ont recensé 224 configurations, allant de 1 pont (882 séquences) à 36 ponts disulfure (1 séquence). En voici quelques exemples. |
![]() |
![]() |
![]() |
![]() |
Source
figures : "CysView"
|
![]() |
![]() |
| Le précurseur de la pappalysine 1 du plasma humain (EC 3.4.24.79) contient 36 ponts disulfure (traits gris sur la figure ci-contre). |
Source figure : PFAM ("Protein families database of alignments and HMMs") |
|
d. Définition de fenêtre d'environnement autour des cystéines |
|
L'étude de Fariselli et al. (1999) a porté sur une fenêtre de 11 acides aminés autour d'une cystéine (AA-5 ... - C - ... AA-5). Les résultats montrent que la formation d'un pont disulfure par la cystéine centrale C est grandement favorisée si l'on trouve dans cet environnement :
|
|
Exemple d'un environnement en acides aminés autour de cystéines impliquées dans des ponts disulfure : signature "Prosite" de la famille des a conotoxines (séquence consensus). C - C - [SHYN] - X(0,1) - [PRG] - [RPATV] - C - [ARMFNHG] - X(0,4) - [QWHDGENFYVP] - [RIVYLGSDW] - C Selon cette notation, on remarque que cet environnement n'est pas défini de manière univoque. En d'autres termes, la même cystéine est impliquée dans un pont disulfure que l'on trouve les acides aminés [R ou P ou A ou T ou V] dans le "voisinage gauche" et que l'on trouve les acides aminés [A ou R ou M ou F ou N ou H ou G] dans le "voisinage droite" . Celà signifie un nombre impressionant de séquences distinctes compatibles avec la formation d'un pont disulfure. |
|
Exemple d'un environnement Approche J.-M. Richer, G. Hunault & E. Jaspard |
![]() |
|
Celà amène à redéfinir ce voisinage non plus selon l'alphabet à 1 lettre des acides aminés (la séquence primaire), mais selon un nouvel alphabet qui tient compte des propriétés physico - chimiques des acides aminés.
|
|
6. Les différentes approches pour la prédiction de cystéines impliquées dans un pont disulfure |
|
Ces méthodes sont les suivantes :
|
|
Exemple d'approche pour la prédiction de cystéines impliquées dans un pont disulfure : 2D DAG - RNN ("Two Dimensional Directed Acyclic Graph - Recursive Neural Network") |
|
Diagramme d'un réseau de neurone (a) et du graphe orienté acyclique ("DAG", b) pour l'analyse d'objets bi-dimensionnels tels que les contacts entre cystéines impliquées dans un pont disulfure. Des noeuds sont disposés de manière régulière dans un plan d'entrée, un plan de sortie et 4 plans cachés . Dans chaque plan, les noeuds sont disposés selon un maillage carré. Les plans cachés contiennent des bordures associées au maillage. Ces bordures sont orientées vers l'un des 4 points cardinaux (NE, NW, SW et SE). Des bordures additionnelles sont orientées verticalement (colonne) du plan d'entrée à chaque plan caché et de chaque plan caché au plan de sortie.
Dans la figure (b), sont indiquées les connections au sein d'une colonne (i, j) du DAG.
|
Source : Cheng et al. (2005) |
|
Dans une carte de prédiction de contacts entre cystéines (impliquées dans un pont disulfure), l'entrée (i, j) représente la probabilité que la ième et la jème cystéine soit ou non liées par un pont disulfure. Cette prédiction dépend directement de l'entrée (i, j) et des 4 unités cachées de la même colonne, associée à la propagation dans les plans cachés. |
| Le modèle peut alors être ramené à 5 réseaux de neurones différents selon la forme : |
|
| 7. Liens Internet et références bibliographiques |
|
Cystéine
et pont disulfure
|
|
|
"Why cysteine is special ? " - Jacek Leluk |
|
|
Frand et al. (2000) "Pathways for protein disulphide bond formation" Trends in Cell Biology 10, 203 - 210 |
|
|
Gross et al. (2004) "Structure of Ero1p, Source of Disulfide Bonds for Oxidative Protein Folding in the Cell" Cell 117, 601 - 610 |
|
|
"Metallothionein" : Site du département de Biochimie (Université deZurich) et "Swiss Institute of Bioinformatics" (SIB) |
|
|
"The KNOTTIN website and database" : A new information system dedicated to the knottin scaffold (Université de Montpellier - CNRS - INSERM) Gelly et al. (2004) "The KNOTTIN website and database : a new information system dedicated to the knottin scaffold" Nucleic Acids Res. 32, D 156 - 159 |
|
|
Prédiction
des cystéines impliquées dans un pont disulfure
|
|
|
PDB-select 25 : Selection of a representative set of PDB chains - Most recent 25% list homologs. |
|
|
Fariselli et al. (1999) "The role of evolutionary information in predicting the disulfide bonding state of cysteines in proteins" Proteins 36, 340 Ð 346 Martelli et al. (2002) "Prediction of the disulfide-bonding state of cysteines in proteins at 88% accuracy" Protein Science 11, 2735 - 2739 Martelli et al. (2002) "Prediction of the disulfide bonding state of cysteines in proteins with hidden neural networks" Protein Engineering 15, 951 - 953 Mucchielli-Giorgi et al. (2002) "Predicting the disulfide bonding state of cysteines using protein descriptors" Proteins 46, 243 Ð 249 Czaplewski et al. (2004) "Prediction of the structures of proteins with the UNRES force field, including dynamic formation and breaking of disulfide bonds" Protein Engineering, Design and Selection 17, 29 - 36 Chen et al. (2004) "Prediction of the bonding states of cysteines using the support vector machines based on multiple feature vectors and cysteine state sequences" Proteins 55, 1036 - 1042 Cheng et al. (2005) "Large-Scale Prediction of Disulphide Bridges Using Kernel Methods, Two-Dimensional Recursive Neural Networks, and Weighted Graph Matching", Proteins, (sous presse) |
|
|
Sites
et logiciels de prédiction liés aux cystéines et
aux ponts disulfure
|
|
DIpro (SCRATCH protein predictor) : DIpro is a cysteine disulfide bond predictor based on 2D recurrent neural network, support vector machine, graph matching and regression algorithms. GDAP: Genomic disulfide analysis program. DISULFIND : Cysteines Bonding State and Connectivity Predictor. Web interface to a set of Machine Learning programs trained to predict the disulfide bonding state and connectivity pattern of the cysteines in a given amino acid sequence. DSDBASE : Database on disulphide bonds in proteins that provides information on native disulphides and those which are stereochemically possible between pairs of residues in a protein. Triads : A program for identifying Cys-Cys-Trp triad motifs in protein structures. |
|