|
|
Applications et résultats de la protéomique : exemple de la RuBisCO |
Sommaire |
| Voir le cours de protéomique |
Aller à SWISS-2DPAGE . Dans le menu "Search by" (en haut à de gauche), choisir "[accession number] ". Dans la fenêtre "Search by accession number or by entry name (AC or ID)", taper le numéro d'accesion : O03042. Commenter les résultats. Ouvrir l'image du gel 2D :
|
|
Aller à la base de données PPDB : "The Plant Proteome Database". Choisir : "Protein Function". Ouvrir l'arborescence (signe "+") : "1 PS (1313)" puis "1.3 PS. calvin cyle (229)". Sélectionner : "1.3.1 PS. calvin cyle.rubisco large subunit (16)" puis "ATCG00490.1". |
|
| Précisez les points suivants : plante / protéine / nombre d'acides aminés / masse molaire / pI | Arabidopsis thaliana / Grande sous-unité de la RuBisCO / longueur : 479 aa / Masse molaire : 52.96 kDa / pI : 5.88 |
|
De quel travail sont issues les données de protéomique concernant les protéines de l'enveloppe totale des chloroplastes ? |
"Published Proteomics Data" 12766230 Ferro et al. (2003) "Proteomics of the Chloroplast Envelope Membranes from Arabidopsis thaliana" Molec. Cell. Proteomics 2, 325 - 345 |
|
D'après cet article, quel est le pourcentage de protéines localisées dans les membranes, les thylacoides, le stroma ? |
Revenir à PPDB. Ouvir le lien "Get sequence" dans la partie "Links" (haut de la page). Récupérer et enregistrer la séquence FASTA. |
RLSAT.fasta | |
| Qu'est-ce que FASTA ? | Format de fichier | Description de l'algorithme de FASTA |
|
Ouvrir une nouvelle page de navigateur. Lancer le programme d'alignement FASTA (EBI) avec la séquence enregistrée . Optimiser les paramètres de l'alignement. Commenter les résultats. |
|
Ouvrir une nouvelle page de navigateur et choisir l'outil "MS-Digest" de la suite logicielle "Protein Prospector". Coller la séquence FASTA BRUTE dans la fenêtre du bas "User Protein Sequence". Cliquer sur "perform digest" pour effectuer l'hydrolyse in silico de la protéine. |
Paramètres à ajuster :
|
| Les valeurs de masse molaire et de pI sont-elles cohérentes avec les précédentes ? | masse molaire : 52956 Da / pI : 5.9 |
| Quels sont la masse isotopique, le nombre d'acides aminés et la modification post-traductionnelle du plus grand et du plus petit fragments ? |
MSPQTETK : mi = 832.4047 Da / 8 aa / modification : perte de la Met et acétylation VTPQPGVPPEEAGAAVAAESSTGTWTTVWTDGLTSLDR : mi = 3854.8719 Da / 38 aa |
|
Rechercher le peptide DLAVEGNEIIR et cliquer sur le lien.
|
|
|
Revenir à la base de données PPDB. Dans la partie "Experimental Evidence", cliquer sur "Details" du chiffre "107". De quel organisme, de quel organe et de quel compartiment proviennent les données ? |
Arabidopsis thaliana / feuille / membrane thylakoide des chloroplastes |
|
Cliquer sur le lien "SeqView" du "spot" N° 53.
|
Peptide : DLAVEGNEIIR / Méthode : LC-ESI-Q-TOF / Digestion par la trypsine / Charge : +2 |
|
Enregistrer ce peptide au format FASTA. Dans une autre page de navigateur, aller à la liste des outils de l'EBI. Lancer "ClustalW2" : aligner la séquence de la grande sous-unité avec le peptide. Le résultat vous parait-il cohérent ? |
|
|
Revenir à la base de données PPDB. Dans la partie "Related Genes", repérer la séquence Os12g10580.1. De quel organisme s'agit-il ? Que vaut la E-value ? |
Oryza sativa / E-value : 1E-126 |
|
Que signifie la E-value qui vaut zéro dans ce tableau pour Osp1g00420.1 de Oryza sativa en regard de la séquence ? Quels critères indiquent le meilleur alignement dans ce tableau ? |
Os12g10580.1 : E-value : 1E-126 / longueur de match : 257 aa / identité : 84% / similarité : 88% Osp1g00420.1 : E-value : 0 / longueur de match : 476 aa / identité: 90% / similarité: 93% |
|
Récupérer la séquence Os12g10580.1 au format FASTA. Aligner cette séquence avec celle de la grande sous-unité de la RuBisCO de Arabidopsis thaliana.
|
1 - 245 aa / oui |
|
Aligner les 3 séquences : grande sous-unité de Arabidopsis thaliana, grande sous-unité de Oryza sativa et le peptide DLAVEGNEIIR. Le résultat est-il étonnant ? Remarque : utiliser différentes matrices et modifier les paramètres des gaps afin de trouver le meilleur alignement. |
|
|
Faire un autre alignement en ajoutant le peptide : LTYYTPEYETK.
|
N-terminal / Experience : 107 / Spot : 78 |
|
Aller dans la catégorie "Proteomics" des outils de "Expasy". Choisir "Translate" (tout en bas de la liste, à droite). Coller la séquence FASTA "U91966.fasta" dans la fenêtre et lancer l'application. Attention : supprimer tout le texte qui n'est pas la séquence proprement dite. |
U91966.fasta
Que signifie "5'3' Frame 1", "5'3' Frame 2", ... ? L'une des traductions vous semble-t-elle cohérente ? |
|
Aller à la page de "ORF Finder" du NCBI. Taper le n° d'accession "U91966.1" et lancer l'application. Rechercher la phase de lecture ouverte la plus cohérente. Quelle longueur fait-elle en nucléotides et pour combien d'acides aminés code-t-elle ? |
|
|
Récupérer la séquence nucléotidique FASTA :
|
ORFframe2.fasta |
|
Revenir au programme "Translate". Coller la séquence FASTA "ORFframe2.fasta" dans la fenêtre et lancer l'application.
Enregistrer la séquence FASTA virtuelle générée. |
5'3' Frame 1 |
Dans une autre page de navigateur, aller à "Pairwise Sequence Alignment". Choisir "Water (EMBOS)". Que fait ce programme ? |
|
|
En optimisant les paramètres, aligner la séquence FASTA "RLSAT.fasta" avec la séquence FASTA "Virtuelle.fasta". Quelle différence y a-t-il entre "RLSAT.fasta" et "Virtuelle.fasta" ? Finalement à quoi correspond la séquence U91966.fasta ? |
"Virtuelle.fasta" est la séquence protéique du précurseur de la grande sous-unité de la RuBisco de Arabidopsis thaliana "RLSAT.fasta". "U91966.fasta" est la séquence génomique de la grande sous-unité de la RuBisco de Arabidopsis thaliana. |
| Liens Internet et références bibliographiques |
|
ExPASy Proteomics tools : Ensemble d'applications pour l'analyse de séquences peptidiques. Bioinformatics Databases and Tools Guide : Liste d'un trés grand nombre d'applications bioinformatiques, de bases de données et autres classées par catégories. Sequence Manipulation Suite : Ensemble d'applications Java pour l'analyse de séquences d'ADN et de protéines. |
|
| Site "Ion source" : spectromètrie de masse. Contient aussi des cours et exercices appliqués à la protéomique à faire en ligne. | Ion source |
| "La bioinformatique en protéomique : analyse des spectres de masse" - F. Rechenmann & I. Quinkal | Aller au site |
| "The Plant Proteome Database for Arabidopsis thaliana and Zea mays" | PPDB |
| "ProMEX : Protein Mass spectra EXtraction" : base de données de spectres de masse d'ions obtenue après hydrolyse tryptique et générés par spectrométrie de masse à piège à ion couplée à la chromatographie liquide - Arabidopsis thaliana. |
ProMEX |
| "AMPDB : the Arabidopsis Mitochondrial Protein Database" | AMPDB |
|
"Arabidopsis thaliana Seed Proteome" (CNRS - INRA - Bayer) |
Seed-proteome |