|
|
Métabolomique : modèles de reconstruction métabolique à l'échelle d'un génome |
1. Introduction 2. Exemple de démarche pour l'élaboration de modèles de reconstruction métabolique 3. Formalisme élémentaire décrivant les vitesses des réactions d'un sytème 4. La matrice de stoechiomètrie S 5. Les modèles métabolique sous contraintes |
6. Vérification de la robustesse des modèles 7. Les méthodes d'analyse des modèles 8. Exemples d'études 9. La base de données de modèles : "Biomodels" - EBI 10. Liens Internet et références bibliographiques |
|
1. Introduction De plus en plus de génomes d'organismes sont séquencés ou en cours de séquençage. Voir les bases de données suivantes :
Les modèles du métabolisme à l'échelle d'un génome établissent le pont entre les informations issues du séquençage de ce génome (et des analyses subséquentes de ce génome), les données biochimiques et les phénotypes lié à ce métabolisme. Cette démarche de métabolomique est récente car elle est la conséquence logique de tous les domaines antérieurs en "omic". |
|
Ainsi, la métabolomique intègre l'ensemble des données issues :
Cette démarche de "métabolomique" nécessite donc de compulser ("data mining") une quantité colossale de données et, bien souvent, de les "nettoyer" (les "curer"). Ce travail méticuleux, extrêmement gourmand en temps est laborieux et systématique. |
|
Les nouvelles données attendues sont une "sur-information" déduite d'un ensemble d'information de base.
|
Figures ci-dessous, vision globale de la démarche "métabolomique" :
La démarche est itérative : la comparaison avec la réalité biologique permet d'ahjuster le modèle
et de le re-confronter aux données réelles et ainsi de suite, afin de l'améliorer. |
Acronyme "GENRE" : reconstruction métabolique à l'échelle d'un génome. Source : Oberhardt et al. (2009) |
|
Cette démarche de "métabolomique" s'appuyant massivement sur des méthodes bioinformatiques, elle est trés largement prédictive. Mais elle permet d'orienter de futures expériences dans des voies prometteuses et épargne un temps précieux de recherche au hasard. Bien évidemment, il existe une étape clé: la confrontation de ces modèles avec la réalité biologique. Cette étape est d'autant plus importante que les modèles peuvent être modifié, améliorés comme tout système d'apprentissage. Remarques :
|
|
La figure ci-contre montre le nombre croissant de reconstruction métabolique à l'échelle d'un génome. Escherichia coli est l'organisme le plus étudié pour l'instant. Source : Oberhardt et al. (2009) "Applications of genome-scale metabolic reconstructions" Mol. Syst. Biol. 5, 320 |
|
2. Exemples de démarche pour l'élaboration de modèles de reconstruction métabolique Le premier pas est d'identifier l'ensemble des réactions, les métabolites impliqués et leur stoechiomètrie et les enzymes qui catalysent ces réactions. Les annotations fonctionnelles disséminées dans les bases de données doivent donc être compulsées, triées et les plus complètes possibles afin d'être traduites en un ensemble de réactions détaillées. La classification de "Enzyme Commission" (EC) fournit un système non ambigu d'association entre enzymes et réactions catalysées. Enzyme : base de données de nomenclature des enzymes avec les N° EC associés. |
|
Figure ci-contre, la démarche générale pour un travail de reconstruction métabolique à l'échelle d'un génome. "gap-analysis" : Source : Oberhardt et al. (2008) |
|
Exemples d'outils pour la reconstruction Source : Pitkänen et al. (2010) |
|
|
3. Formalisme élémentaire décrivant les vitesses des réactions d'un sytème |
| Considérons la réaction R1 : | k1 A -----------> B . |
| Et la réaction R2 : | k2 2B -----------> C . |
| La vitesse de la variation de la concentration de A s'écrit : | d[A] --------- = - 1 . k1 . [A] dt |
| La vitesse de la variation de la concentration de B s'écrit : | d[B] --------- = (+ 1 . k1 . [A]) + (- 2 . k2 . [B]2) dt |
| La vitesse de la variation de la concentration de C s'écrit : | d[C] --------- = + 1 . k2 . [B]2 dt |
| Pour l'ensemble du système, on a la relation : |
|
Qui s'écrit dans le cas du système des 2 réactions R1 et R2 : |
![]() |
Par convention :
|
Source : Durot et al. (2009) |
5. Les modèles métaboliques sous contraintes Le formalisme des vitesses des réactions enzymatiques peut-être une expression complexe de [la concentration des métabolites x constantes de vitesse des réactions]. De plus ces vitesses sont en permanence modulées par les processus de régulation :
Décrire par le détail les équations qui traduiraient ces deux parties (cinétique enzymatique et processus de régulation) est une gageure tant sur le plan mathématique que sur le nombre de données requises. Et ce d'autant que l'on a aucune certitude de disposer de manière exhaustive de ces données ni même de jamais pouvoir les obtenir. Pour s'en convaincre, il suffit de regarder ce que l'on connait du métabolisme de base. On mesure la complexité inouie des modèles qu'il faudrait développer. En pratique, à ce jour, on restreint donc la modélisation cinétique des réseaux métaboliques d'une "cellule entière" à des modèles plus "petits" qui incluent des centaines (voire des miliers) de réactions (d'enzymes) et de métabolites, associés à autant de gènes. |
Voir une simulation du réseau d'interactions de la glycolyse, de la néoglucogénèse et du cycle de Krebs. On peut modifier différents paramètres de manière interactive. |
|
Ainsi, les modèle du métabolisme sous contraintes contournent ces limitations en focalisant sur la moyenne des vitesses des réactions qu'atteint la croissance cellulaire dans un environnement stable - stationnaire ou évoluant trés lentement. La notion d'état stationnaire est capitale. Cette approximation est justifiée en regard de la différence d'échelles de temps sont trés différentes :
En d'autres termes : la vitesse de renouvellement des métabolites étant trés élevée chez les bactéries à l'échelle de temps considéré (la minute), on peut considérer que leur concentration a atteint l'état stationnaire et qu'elle est alors constante tant qu'il n'y a pas de variation de l'environnement. |
|
En conséquence, pour simplifier les modèles, on s'appuie sur le fait que l'état métabolique d'une cellule et sa variation dans le temps peuvent être décrits par la concentration des métabolites et la vitesse des réactions. Ces quantités sont liées par la loi de la conservation de la matière : la vitesse de production nette d'un métabolite est égale à la somme des vitesses des réactions qui le consomment et des vitesses des réactions qui le produisent, pondérées par les coefficients stoechiomètriques associés à chaque réaction. Cette loi contraint la consommation et la production à être équilibrée ( le terme anglo-saxon est "balanced") : c'est ce que l'on appelle l'hypothèse du quasi-équilibre. La contrainte sur les vitesses de réaction s'apelle la contrainte d'équilibre des masses ou contrainte stoechiométrique des masses ("mass balance constraint"). Ainsi, pour chaque métabolite d'un tel système "équilibré", on peut écrire une expression mathématique simple de la contrainte d'équilibre des masses linéaire qui met en jeu la vitesse des réactions :
Remarque : le formalisme mathématique global des modèles est beaucoup plus complexe. |
Ci-dessous, un schéma qui décrit un modèle, la matrice de coefficients stoechiomètriques et des prédictions dans le cas de 2 types de contrainte :
|
Source : Génoscope |
Les vitesses de réactions sont représentées par de simples nombres : les flux de réactions qui sont normalisés par le poids des cellules. L'unité des flux de réactions est donc : mmol.h-1.g-1 de matière sèche (en anglais : "mmol.h-1.g-1 dry weight" ou "mmol.h-1.g-1 DW"). |
Besoins cellulaires en ATP hors croissance ("Non-growth associated ATP maintenance requirement / NGAM") C'est la quantité d'ATP dont a besoin toute cellule même quand il n'y a pas de croissance. Il s'agit donc de l'énergie consommée pour tous processus autres que la la formation de nouveau matériel cellulaire. Dans l'étude ci-contre, les auteurs ont maximisé le renouvellement en ATP sous une contrainte d'absorption du glucose d e1 mmol.h-1.g-1de matière sèche, et ainsi la quantité d'ATP nécessaire a été évaluée à : Qmax = 21.5 mol ATP.mol-1 glucose. Sur la base de cette valeur et du point d'intersection avec l'axe des ordonnées (0.105 mmol glucose.h-1.g-1de matière sèche), les auteurs ont calculé un NGAM # 2.26 mmol ATP.h-1.g-1de matière sèche. |
Source : Chung et al. (2010) |
|
6. Vérification de la robustesse des modèles et amélioration a. Les difficultés pour modéliser pleinement le métabolisme (liste non-exhaustive) :
b. Le cas des réactions et des enzymes manquantes (connues et/ou non connues)
Gevorgyan et al. (2008) "Detection of stoichiometric inconsistencies in biomolecular models" Bioinformatics 24, 2245 - 2251 c. Schéma general du processus itératif de vérification et d'amélioration d'un modèle de reconstruction. Un modèle initial est reconstruit à partir d'annotations de génomes, de données biochimiques et physiologiques, disséminées dans diverses bases de données (généralistes ou spécialisées). |
Le modèle qui en résulte est alors corrigé et affiné de manière itérative :
La reconstruction que la vérification d'un modèle métabolique est donc un travail colossal en terme de données à compulser, trier ("data mining"), voire à corriger ("curation"). C'est un travail extrêmement long. Source : Durot et al. (2009) |
|
d. Exemple d'un cycle de reconstruction itérative d'un modèle Figure ci-dessous : détail d'un cycle de reconstruction d'un sous-ensemble de réactions à partir d'un réseau (ensemble coordonnée de réactions) existant. 1. Un modèle est construit qui tient compte de l'entrée et de la sortie de nutriments ("Exc i") avec une synthèse globale de matériel biologique ("Biomass"). On constate qu'aucune réaction n'est privilégiée. 2. Une matrice de coefficients stoechiomètriques (voir ci-dessus) est construite. 3. Les vitesses de chacune des réactions de ce système sont calculées à partir de cette matrice et des équations de vitesse de chaque réaction. 4. Ce modèle est appliqué au système biologique soumis à une condition expérimentale particulière (ici, inactivation d'une réaction - R7 - et absence d'un nutriement - F). 5. Les points de convergence et les différences entre le modèle théorique et celui qui correspond à la réalité biologique permettent de re-construire le modèle théorique selon le même principe afin de le re-confronter à celui qui décrit la condition expérimentale. |
Source : Durot et al. (2009) Voir en particulier : "Table 4 : Existing genome-scale metabolic models for bacterial organisms" |
|
Ce processus itératif permet d'améliorer le modèle théorique afin qu'il traduise le mieux possible la réalité biologique et puisse être extrapolé à d'autres conditions. Exemples d'outils bioinformatiques pour la vérification de modèles :
|
|
a. Descriptions de quelques théories et concepts Article : Bennett et al. (2009) "Absolute Metabolite Concentrations and Implied Enzyme Active Site Occupancy in Escherichia coli" Nat. Chem. Biol. 8, 593 - 599
Ces théories permettent d'établir un lien entre la concentration des métabolites et la direction du flux métabolique. En effet, le sens de n'importe quelle réaction du métabolisme est dictée par la variation d'énergie libre de Gibbs (ΔG'réaction) qui lui est associée. Or celle-ci dépend exclusivement des concentrations intracellulaires (physiologiques / [X]φ) des métabolites impliqués dans cette réaction. Les concentrations [X]éq sont celles qui décrivent le système quand l'équilibre est atteint dans les conditions standards.
|
L'une des techniques les plus performantes pour mesurer les concentrations d'un trés grand nombre de métabolites est la spectromètrie de masse (par exemple : "liquid chromatography-tandem mass spectrometry"), combinée au marquage par des radioéléments. Source figure : Kell DB (2004) "Metabolomics and systems biology: making sense of the soup" Curr. Opin. Microbiol. 7, 296 - 307 |
|
Article : Henry et al. (2007) "Thermodynamics-based metabolic flux analysis" Biophys. J. 92, 1792 - 1805 TMFA et rapports des concentrations ATP/ADP, NAD(P)/NAD(P)H, H+extracellulaire/H+intracellulaire. b. L'analyse de la balance des flux ("Flux balance analysis - FBA") Cette approche ne nécessite pas de connaitre la concentration des métabolites ni le détail des cinétiques enzymatiques du système. L'hypothèse est que le système étudié est homéostatique. Le question à résoudre dés lors s'énonce de la manière suivante : compte-tenu de nutriements disponibles, quel ensemble de flux métaboliques maximise la vitesse de croissance de l'organisme tout en préservant la concentration intracellulaire des métabolites ? c. Autres méthodes d'analyse
|
|
Figure ci-contre, la procédure suivie pour la reconstruction métabolique de Pichia pastoris. Voir les données statistiques des éléments du modèle final. Source : Chung et al. (2010) Liens vers les bases de données mentionnées dans cette figure. |
|
Etude du contrôle du métabolisme glucidique lié aux diabètes de type 2 |
Figure ci-contre : schéma synoptique de la méthode d'identification de métabolites rapporteurs et des motifs de séquences régulatrices associées. Source : Zelezniak et al. (2010) "Metabolic Network Topology Reveals Transcriptional Regulatory Signatures of Type 2 Diabetes" PLOS Comput. Biol. |
|
A) Système de score pour l'identification de métabolites rapporteurs, basé sur les scores des réactions enzymatiques associées. Pour chaque enzyme, un score est aussi calculé sur la base de la "p-value" de la séquence nucléotidique du gène correspondant. Dans le cas de réactions catalysées par un complexe enzymatique ou un ensemble d'isoformes d'une même enzyme, la valeur minimale de la "p-value" de ces enzymes est retenue.
B) Identification des motif de fixation des facteurs de transcription. Pour un métabolite rapporteur, un ensemble de gènes homologues codant des enzymes qui sont sur- ou sous-exprimés est sélectionné. Les régions promotrices et les motifs situés en amont des sites de démarrage de la transcription ("transcription start site - TSS") de chaque gène sélectionné sont annotés selon leur teneur en motifs de fixation des facteurs de transcription ("TF"). |
Figure ci-contre : signatures métabolique et régulatrice des diabètes de type 2. Source : Zelezniak et al. (2010) |
|
Les métabolites rapporteurs appartenant aux voies clés de la régulation des diabètes de type 2 sont écrits en gras.
Une sur-alimentation chronique et un manque d'activité physique augmentent l'entrée d'acides gras, ce qui induit la β-oxidation via l'activation des gènes médiée par le facteur activé de prolifération des peroxysomes (récepteur nucléaire - PPARα/δ - "peroxisome proliferator-activated receptor alpha and delta") sans qu'il y ait une augmentation coordonnée du flux du cycle des acides tricarboxyliques (TCA). Une conséquence possible est l'accumulation dans les mitochondries de dérivés de métabolites (exemples : acylcarnitines ou molécules réactives dérivées de l'oxygène - "reactive oxygen species - ROS") issus d'une β-oxidation incomplète. Ces stress pourrait induire une "surcharge mitochondriale" qui, de concert avec des molécules lipidiques de signalisation (exemple : le dyacylglycérol - DAG) enclencheraient une cascade impliquant des (Ser/Thr) protéines kinases, cascade qui serait initiée par une nouvelle protéine kinase nPKCs ("novel protein kinase Cs"). Il en résulte une phosphorylation des sites (Ser/Thr) du substrat 1 du récepteur de l'insuline (IRS-1) qui a pour conséquences :
Ces 2 évènements entravent la translocation du transporteur du glucose de type 4 (GLUT4) ce qui diminue le transport du glucose et donc la synthèse du glycogène. Une augmentation de l'activité physique ou le jeûne activent la protéine PGC1α (co-activateur 1α du récepteur nucléaire PPARγ) et la protéine CREB ("cAMP response element binding protein"), un activateur puissant de PGC1. Ces évènements atténuent le effets du stress lipidique en augmentant le flux du TCA et en couplant l'activité induite par la fixation du ligand sur PPARα/δ avec le remodelage médié par PGC1α des voies métaboliques situées en aval telles que la respiration et la β-oxidation. Légende : CDP-choline, cytidine diphosphate choline; G1P, glucose 1-phosphate; G6P, glucose 6-phosphate; GSK3, glycogen synthase kinase-3; IRE1, inositol requiring kinase-1; LC-CoAs, long-chain acyl CoAs; PA, phosphatidate; PH, pleckstrin homology domain;PI, phospatidylinositol; PIP, phospatidylinositol 4-phospate; PIP2, phosphatidylinositol 4,5-bisphospate, PIP3, phospatidylinositol 3,4,5-trisphospate; PTB, phosphotyrosine binding domain; RXR, retinoid X receptor; SH2, src homology domain; TF, transcription factor; CPT1, carnitine palmitoyltransferase-1; PTDETN, phosphatidylethanolamine. |
9. La base de donnée de modèles : "Biomodels" - EBIBioModels Database - "A Database of Annotated Published Models".Cliquer sur le lien : "Browse models using GO".
|
|
Source : Wang et al. (2007) |
a. Quel type de signal ce modèle essaye-t-il de modéliser ? b. Faire le lien entre les informations contenues dans l'onglet "Math" et le modèle décrit ci-dessus. c. Dans le menu déroulant "Actions" :
d. Quelle information obtient-on dans l'onglet «Physical entities» ? |
| e. Aller à : "Models of the
month".
March 2010, model of the month - C. Hoyer : Borisov et al. (2009) "Systems-level interactions between insulin-EGF networks amplify mitogenic signaling" Mol Syst Biol. 5, 256 Quelques mots clés : "Epidermal growth factor / Insulin / EGF receptors (EGFR) / Insulin receptor / receptor tyrosine kinases" Cet article illustre le modèle : BIOMD0000000223 - Borisov 2009 EGF Insulin Crosstalk |
| 10. Liens Internet et références bibliographiques |
|
|
|
Oberhardt et al. (2008) Genome-Scale Metabolic Network Analysis of the Opportunistic Pathogen Pseudomonas aeruginosa PAO1" J Bacteriol. 190, 2790 - 2803 Oberhardt et al. (2009) "Applications of genome-scale metabolic reconstructions" Mol. Syst. Biol. 5, 320 Durot et al. (2009) "Genome-scale models of bacterial metabolism: reconstruction and applications" FEMS Microbiol Rev. 33, 164 - 190 Pitkänen et al. (2010) "Computational methods for metabolic reconstruction" Curr. Opin. Biotech. 21, 70 - 77 |
|
Bennett et al. (2009) "Absolute Metabolite Concentrations and Implied Enzyme Active Site Occupancy in Escherichia coli" Nat. Chem. Biol. 8, 593 - 599 Zelezniak et al. (2010) "Metabolic Network Topology Reveals Transcriptional Regulatory Signatures of Type 2 Diabetes" PLOS Comput. Biol. 6, e1000729 |
|
|
Lee JM et al. (2008) "Dynamic Analysis of Integrated Signaling, Metabolic, and Regulatory Networks" PLoS Comput Biol. 5 Yizhak et al. (2010) "Integrating quantitative proteomics and metabolomics with a genome-scale metabolic network model" Bioinformatics 26, i255 - i260 |
|
| Borisov et al. (2009) "Systems-level interactions between insulin-EGF networks amplify mitogenic signaling" Mol Syst Biol. 5, 256 | Article |
| Alper et al. (2005) "Tuning genetic control through promoter engineering" Proc. Natl. Acad. Sci. USA 102, 12678 - 12683 | Article |
Chung et al. (2010) "Genome-scale metabolic reconstruction and in silico analysis of methylotrophic yeast Pichia pastoris for strain improvement" Microbial Cell Factories 9, 50 |
Article |
Henry et al. (2007) "Thermodynamics-Based Metabolic Flux Analysis" Biophys J 92, 1792 - 1805 Wang et al. (2007) "A quantitative kinetic model for ATP-induced intracellular Ca2+ oscillations" J. Theor. Biol. 245, 510 - 519 Boghigian et al. (2010) "Utilizing elementary mode analysis, pathway thermodynamics, and a genetic algorithm for metabolic flux determination and optimal metabolic network design" BMC Syst Biol 4, 49 |
|