Le repliement des protéines ("Protein folding")

1. Introduction

2. Aspect cinétique - Paradoxe de Levinthal

3. Aspect thermodynamique

4. Rôle du solvant : l'eau

5. Modèles du repliement

6. Expériences de calcul partagé pour la simulation du repliement

7. Liens Internet et références bibliographiques

 

1. Introduction

Le processus par lequel la chaîne polypeptidique d'une protéine acquière une structure tridimensionnelle s'appelle le repliement. Ce processus n'est pas encore connu.

voir une animation

  • molécule "simple" : quand W. Bragg et L. Bragg (Prix Nobel 1915) ont les premiers résolu la structure du NaCl, les résultats ont modifié les concepts liés aux forces de liaison au sein des molécules ionisées.
  • ADN : en 1953, la structure en double hélice de l'ADN a été résolue par F. Crick , J. Watson et M. Wilkins (Prix Nobel 1962). L'information dans l'ADN est sous forme linéaire. En conséquence, les molécules d'ADN ont une structure semblable.
  • protéine : la première détermination par cristallographie de la structure d'une protéine globulaire, la myoglobine (J. Kendrew - 1958 - Prix Nobel 1962), a été une sorte de déception quant à l'élucidation du mécanisme du repliement des protéines. La situation est beaucoup plus complexe que dans le cas des acides nucléiques.

En effet, chacune des milliers de protéines qui existent dans une cellule doit reconnaitre spécifiquement un (ou quelques) ligand(s).

Cette reconnaissance s'effectue grâce à de subtiles interactions entre la structure tridimensionnelle de la protéine et celle(s) du (des) ligand(s).

Une telle persité d'interactions aussi précises ne peut être obtenue qu'avec des structures de protéines extrêmement variées et irrégulières.

 

  • comment une protéine se replie-t-elle ?
  • existe-t-il un seul mécanisme commun à toutes les protéines ?
  • si non, y a-t-il autant de mécanisme que de protéines ? que de famille de protéines ? ...

Pour mesurer la compléxité de ce (ou ces) mécanisme(s), rappelons que :

  • 20 acides aminés sont principalement utilisés dans la composition des protéines (on en a recensé 339) : hydroxyproline (collagène), hypusine, β-acides aminés (isoserine), γ-acides aminés (statine), ω-acides aminés (ε-acide aminocaproique, 11-acid amino-undécaoïque), citrulline, isovaline, pseudoleucine, desmosine, norvaline, diéthylglycine, ...
  • les protéines peuvent contenir de quelques dizaines d'acides aminés (les toxines) à quelques ... milliers !
  • les protéines ont donc des masses molaires de 5 kDa à 590 kDa (calossine - 5322 acides aminés !)
  • les protéines ont des pI qui s'échelonnent de 2 (glucose-1-phospho-D-mannosylglycoprotéine phosphodiestérase) à 12 (cathepsine G)
  • (presque) toutes les combinaisons d'enchaînement de ces acides aminés sont possibles en théorie (mais loin d'être toutes "sélectionnées" par la nature)
  • les protéines sont sous forme de monomère (une chaîne polypeptidique) ou de polymères (plusieurs chaînes polypeptidiques identiques ou non)
  • le rayon moyen d'une protéine repliée (assimilée à une sphère ou globulaire) est d'environ 40 Å
  • les échelles de temps du repliement s'étendent de l'ordre de 10-9 s à 10-3 s
  • l'espace des phases du repliement d'une protéine comporte de nombreux minima locaux
  • la transition du repliement est une transition du 1er ordre avec une perte d'entropie d'ordre kB par monomère

 

 

La figure ci-contre montre la "hiérarchie" des 4 niveaux de structures des protéines.

 

Christian ANFINSEN (Prix Nobel 1972) a montré que, dans un environnement approprié :

toute l'information nécessaire au repliement d'une protéine dans sa structure native (donc fonctionnelle) est contenue dans sa séquence primaire (l'enchaînement des acides aminés).

 

Pour rendre compte de la complexité du processus du repliement, on peut préciser :

  • la polarité de l'enchaînement des carbones a des acides aminés : lors de sa biosynthèse, la chaîne polypeptidique s'étend de l'extrémité N-terminale vers l'extrémité C-terminale.
  • les contraintes stériques induites par la liaison entre deux acides aminés consécutifs ou liaison peptidique.

 

Quatre types de structures des proteines

 

Types d'interactions au sein des proteines

Représentation schématique des liaisons au sein d'une protéine repliée.

Les liaisons qui s'établissent au sein d'une protéine et qui stabilisent la structure native sont :

liaison

énergie (kcal/mole)

covalentes : pont disulfure

90

électrostatiques

3

hydrogène

3 - 7

la valeur dépend du donneur - accepteur

contacts de van der Waals

0,1 - 1

interactions hydrophobes

pas une liaison au sens strict, mais rôle clé dans la stabilisation

les propriétés physico - chimiques et les contraintes stériques de la liaison peptidique (la chaîne principale)

Retour haut de page

 

2. Aspect cinétique - Paradoxe de Levinthal

Le nombre de conformations d'une chaîne polypeptidique de n acides aminés (susceptibles d'adopter s structures secondaires) est sn.

Soit pour n = 100 acides aminés et s = 13 structures secondaires, un temps de 1085 secondes ou 3 1017 ... siècles !

Un processus du repliement s'opèrant selon une recherche au hasard de la structure de plus basse énergie (la plus stable) est donc absolument impossible du point de vue cinétique et totalement incompatible avec les grandeurs de temps de la vie.

C'est le paradoxe de Levinthal (1968) [J. Chem. Phys. 65, 44 - 45].

Les études de la cinétique du repliement ont montré l'existence de structures intermédiaires instables. La grande difficulté a toujours résidé dans l'isolement (et donc la caractérisation) de ces intermédiaires peu peuplés et trés labiles (temps de demi-vie trés courts).

Cependant, les données accumulées montrent actuellement que le le repliement correspond :

  • à une ou des étape(s) initiale(s) rapide(s)
  • suivie(s) de réarrangements structuraux plus lents (ajustements conformationnel locaux)

Une théorie a été développée par A. R. Fersht : elle porte sur l'aspect cinétique du repliement (via les équilibres entre intermédiaires et/ou états globaux : état natif, états dénaturés, états structuraux intermédiaires).

3. Aspect thermodynamique

Les états dénaturés (l'ensemble des conformations qu'une chaîne polypeptidique adopte quand elle n'est pas repliée ou est incorrectement repliée) et l'état natif (unique) d'une protéine ont des niveaux d'énergie trés proches.

En revanche, leur différence d'entropie (le nombre des configurations possibles dans chaque état) est trés importante. Du point de vue statistique, on peut donc considérer que l'état natif est largement improbable (c'est une autre illustration du paradoxe de Levinthal).

Les données actuelles sont en faveur d'un processus du repliement contrôlé thermodynamiquement. La formation de la structure native (le fond de l'entonnoir dans la figure ci-contre) s'accompagne d'une diminution de l'entropie. [Ref. : Wolynes, Onuchic & Thirumalai (1995) Science 267, 1619 - 1620].

Les intermédiaires structuraux dont la formation est sous contrôle cinétique aboutissent à la formation de la structure native.

Récemment la question a été posée de savoir si l'hypersurface du potentiel qui dirige le repliement est constituée de minima multiples ou s'il s'agit d'un système percolatoire dans lequel ces minima seraient des points de selle.

Thermodynamique du repliement minima locaux

Figure adaptée de Benhabilès et al. (2000)

Les diverses implications de l'étude du repliement des protéines.

Les implications de l'etude du repliement des proteines - protein folding

Source : Ferreon et al. (2011)

 

4. Rôle du solvant : l'eau

Le solvant naturel (dans la cellule) des protéines est l'eau : elle joue un rôle absolument capital dans le repliement et la stabilisation des états conformationnels intermédiaires.

Le repliement s'accompagne d'une importante augmentation de l'entropie de l'eau, qui compense la diminution de celle de la chaîne polypeptidique (voir ci-dessus).

Le repliement est un processus dynamique :

  • le point de départ est l'état déplié qui correspond schématiquement à la chaîne polypeptidique hydratée (beaucoup d'acides aminés sont en contact avec l'eau)
  • dans l'état natif, se sont quasi exclusivement les acides aminés situés en surface de la protéine qui sont au contact du solvant

Remarque : il faut mentionner

  • les molécules d'eau dites de "structure" qui participent aux liaisons intra-moléculaires qui stabilisent la structure native
  • les molécules d'eau présentes au niveau du site actif qui sont impliquées dans l'acte catalytique de certaines enzymes

 

5. Modèles du repliement

Modèle

Description

Références choisies

nucléation - condensation

Il y a une étape de nucléation suivie par une propagation rapide de la structure.

C'est un modèle qui prend en compte le caractère coopératif du repliement.

Zimm & Bragg (1959)

J. Chem. Phys. 31, 526 - 535

Wetlaufer (1973)

Proc. Natl. Acad. Sci. USA 70, 697 - 701

diffusion - collision

La nucléation intervient en plusieurs points de la chaîne polypetidique. Ces noyaux diffusent et coalescent.

On aboutit à des microstructures natives. Le repliement est une succession d'étapes de diffusion - collision.

Karplus & Weaver (1994)

Protein Sci. 3, 650 - 668

repliement séquentiel et hiérarchique

Plusieurs segments de structures sont formés et assemblés à différents niveaux suivant un chemin du repliement unique (Baldwin, 1975).

Schulz (1977) a proposé que ce repliement soit hiérachique : la nucléation est suivie par la formation de structures super - secondaires puis par celle des domaines (voire du monomère).

Baldwin (1975)

Annu. Rev. Biochem. 44, 453 - 475

Schulz (1977)

Angew. Chem. 16, 23 - 32

modèle modulable du repliement

Les domaines d'une protéine sont les unités du repliement (Wetlaufer, 1981).

Ils se replient indépendamment et des intermédiaires du repliement (les modules structuraux) sont formés et s'assemblent pour aboutir à la structure native (Chotia, 1984).

Wetlaufer (1981)

Adv. Protein Chem. 34, 61 - 92

Chotia (1984)

Annu. Rev. Biochem. 53, 537 - 572

modèle d'effondrement (collapse)

Le premier évènement du repliement est un effondrement hydrophobe avant la formation des structures secondaires.

Cet effondrement conduit à la stabilisation de la strucure native.

Levitt & Warshel (1975)

Nature 253, 693 - 698

fermeture éclair hydrophobe

La formation de segments de structures secondaires est simultanée avec l'effondrement hydrophobe.

Dill, Fiebig & Chan (1993)

Proc. Natl. Acad. Sci. USA 90, 1942 - 1946

 

homopolymère et extension de ce modèle

Modèle qui décrit certains aspects universels des protéines comme les régions spatialement structurées en hélice ou en feuillet. La protéine est alors considérée comme un polymère où tous les maillons sont identiques (homopolymère).

Modèle qui va au-delà du modèle simple d'homopolymère : tous les acides aminés sont identiques à l'exception de la glycine et de la proline.

aller au site

autres modèles

Les modèles de verres de spin peuvent être appliqués au repliement en décrivant les protéines comme des hétéropolymères aléatoires.

Une protéine serait un objet quantique dont on pourrait expérimentalement observer les états excités selon différents modes.

 

 

6. Expériences de calcul partagé pour la simulation du repliement

Les échelles de temps du repliement s'étendent de l'ordre de 10-9 s à 10-3 s. Certaines sont trop courtes pour être analysées avec les technologies actuelles. Elles peuvent être simulées par ordinateur.

Depuis quelques années, des expériences de calcul partagé (grille ou "grid" : ensembles d'ordinateurs en réseau) ont lieu dans le but est de prévoir la structure d'une protéine.

L'une des initiatives les plus intéressantes est le projet "Folding@Home" de l'Université de Stanford (USA).

Un autre exemple de calcul massif parallèle est le projet Décrypthon lancé le 15 mars 2005 par l'Association française contre les myopathies (AFM), le CNRS et la société d'informatique IBM. Ces grilles permettront de générer la puissance de calcul nécessaire au traitement de projets de recherche complexes, en génomique et en protéomique.

La base de données "REFOLD", créée par A. Buckle et S. Bottomley (Université Monash, Australie), est un recueil rare et superbe.

Elle donne un trés large éventail d'information sur les méthodes et modes opératoires pour le repliement de plusieurs centaines de protéines. Pour chacune de ces protéines, un grand nombre d'informations croisées sont disponibles.

 

7. Liens Internet et références bibliographiques

"Introduction à la structure des protéines" - C. Branden & J. Tooze (1996) - ed. De Boeck Université

Anfinsen, C. B., et al. (1961) Proc. Natl. Acad. Sci. USA 47, 1309 - 1314

Fersht, A. R. (2002) "On the simulation of protein folding by short time scale molecular dynamics and distributed computing" PNAS 99, 14122 - 14125

Ferreon et al. (2011) "Protein folding at single-molecule resolution" Biochim. Biophys. Acta 1814, 1021 - 1029

Article

Article

Benhabilès, N., Thomas, A. & Brasseur, R. (2000) Biotechnol. Agron. Soc. Environ. 4, 71 - 81. Un article (court) remarquablement écrit. Une synthèse claire et trés pédagogique du repliement.

Chow et al. (2005) "REFOLD: An analytical database of protein refolding methods" Protein. Expr. Purif. 46, 166 - 171

REFOLD

"Disulfide Bridge DataBase" (J.-M. Richer, G. Hunault & E. Jaspard - Université d'Angers) : Database developped for the predictive analysis of cysteine residues involved in intra and inter disulfide bridges.

DBDB

Expériences de calcul partagé dont le but est de prévoir la structure d'une protéine :

  • "Folding@Home" - Stanford
  • Predictor@home
  • Rojnuckarindagger et al. (1998) "Brownian dynamics simulations of protein folding: Access to milliseconds time scale and beyond" Biophysics 95, 4288 - 4292

Folding@Home

Predictor@home

 

Valid XHTML 1.0 Transitional Retour haut de page