Applications et résultats de la protéomique : exemple de la RuBisCO

Sommaire
Voir le cours de protéomique

Aller à SWISS-2DPAGE . Dans le menu "Search by" (en haut à de gauche), choisir "[accession number] ".

Dans la fenêtre "Search by accession number or by entry name (AC or ID)", taper le numéro d'accesion : O03042.

Commenter les résultats.

Ouvrir l'image du gel 2D :

  • Combien y a-t-il de spots ?
  • A quoi correspondent-ils ?
  • Quelle différence y a-t-il entre ces protéines ?

 

Aller à la base de données PPDB : "The Plant Proteome Database".

Choisir : "Protein Function".

Ouvrir l'arborescence (signe "+") : "1 PS (1313)" puis "1.3 PS. calvin cyle (229)".

Sélectionner : "1.3.1 PS. calvin cyle.rubisco large subunit (16)" puis "ATCG00490.1".

Précisez les points suivants : plante / protéine / nombre d'acides aminés / masse molaire / pI Arabidopsis thaliana / Grande sous-unité de la RuBisCO / longueur : 479 aa / Masse molaire : 52.96 kDa / pI : 5.88

De quel travail sont issues les données de protéomique concernant les protéines de l'enveloppe totale des chloroplastes ?

"Published Proteomics Data" 12766230

Ferro et al. (2003) "Proteomics of the Chloroplast Envelope Membranes from Arabidopsis thaliana" Molec. Cell. Proteomics 2, 325 - 345

D'après cet article, quel est le pourcentage de protéines localisées dans les membranes, les thylacoides, le stroma ?

Revenir à PPDB. Ouvir le lien "Get sequence" dans la partie "Links" (haut de la page).

Récupérer et enregistrer la séquence FASTA.

RLSAT.fasta
Qu'est-ce que FASTA ? Format de fichier Description de l'algorithme de FASTA

Ouvrir une nouvelle page de navigateur.

Lancer le programme d'alignement FASTA (EBI) avec la séquence enregistrée . Optimiser les paramètres de l'alignement.

Commenter les résultats.

Cours matrices

Ouvrir une nouvelle page de navigateur et choisir l'outil "MS-Digest" de la suite logicielle "Protein Prospector".

Coller la séquence FASTA BRUTE dans la fenêtre du bas "User Protein Sequence".

Cliquer sur "perform digest" pour effectuer l'hydrolyse in silico de la protéine.

Paramètres à ajuster :

  • choisir "User protein" dans le menu "Database".
  • supprimer le N° d'accession dans la fenêtre "List of Entries".
  • choisir "Trypsin" dans le menu "Digest".
  • choisir "ESI_Q_TOF" dans le menu "Instrument".
Les valeurs de masse molaire et de pI sont-elles cohérentes avec les précédentes ? masse molaire : 52956 Da / pI : 5.9
Quels sont la masse isotopique, le nombre d'acides aminés et la modification post-traductionnelle du plus grand et du plus petit fragments ?

MSPQTETK : mi = 832.4047 Da / 8 aa / modification : perte de la Met et acétylation

VTPQPGVPPEEAGAAVAAESSTGTWTTVWTDGLTSLDR : mi = 3854.8719 Da / 38 aa

Rechercher le peptide DLAVEGNEIIR et cliquer sur le lien.

  • Quelle est la masse moyenne de l'ion [M+H]+ ?
  • Quels types d'ions N-terminaux et C-terminaux la fragmentation de ce peptide génère-t-elle ?
  • mav = 1229.3838
  • N-terminal : ions a et b / C-terminal : ions y

 

Revenir à la base de données PPDB. Dans la partie "Experimental Evidence", cliquer sur "Details" du chiffre "107".

De quel organisme, de quel organe et de quel compartiment proviennent les données ?

Arabidopsis thaliana / feuille / membrane thylakoide des chloroplastes

Cliquer sur le lien "SeqView" du "spot" N° 53.

  • Quel peptide a été identifié ?
  • Par quelle méthode de spectroscopie ?
  • Par quelle protéase a-t-il été généré ?
  • Quelle est la charge de l'ion ?
Peptide : DLAVEGNEIIR / Méthode : LC-ESI-Q-TOF / Digestion par la trypsine / Charge : +2

Enregistrer ce peptide au format FASTA. Dans une autre page de navigateur, aller à la liste des outils de l'EBI.

Lancer "ClustalW2" : aligner la séquence de la grande sous-unité avec le peptide. Le résultat vous parait-il cohérent ?

Retour haut de page

 

Revenir à la base de données PPDB. Dans la partie "Related Genes", repérer la séquence Os12g10580.1.

De quel organisme s'agit-il ? Que vaut la E-value ?

Oryza sativa / E-value : 1E-126

Que signifie la E-value qui vaut zéro dans ce tableau pour Osp1g00420.1 de Oryza sativa en regard de la séquence ?

Quels critères indiquent le meilleur alignement dans ce tableau ?

Os12g10580.1 : E-value : 1E-126 / longueur de match : 257 aa / identité : 84% / similarité : 88%

Osp1g00420.1 : E-value : 0 / longueur de match : 476 aa / identité: 90% / similarité: 93%

Récupérer la séquence Os12g10580.1 au format FASTA.

Aligner cette séquence avec celle de la grande sous-unité de la RuBisCO de Arabidopsis thaliana.

  • Sur quelle partie les deux séquences s'alignent-elles le mieux ?
  • Est-ce cohérent avec les résultats du tableau ?

Os12g10580.1

1 - 245 aa / oui

Aligner les 3 séquences : grande sous-unité de Arabidopsis thaliana, grande sous-unité de Oryza sativa et le peptide DLAVEGNEIIR. Le résultat est-il étonnant ?

Remarque : utiliser différentes matrices et modifier les paramètres des gaps afin de trouver le meilleur alignement.

Faire un autre alignement en ajoutant le peptide : LTYYTPEYETK.

  • Où se situe ce peptide dans la séquence ?
  • A quelle expérience et à quel spot correspond-il ?
N-terminal / Experience : 107 / Spot : 78

 

Aller dans la catégorie "Proteomics" des outils de "Expasy".

Choisir "Translate" (tout en bas de la liste, à droite).

Coller la séquence FASTA "U91966.fasta" dans la fenêtre et lancer l'application.

Attention : supprimer tout le texte qui n'est pas la séquence proprement dite.

U91966.fasta

Que signifie "5'3' Frame 1", "5'3' Frame 2", ... ?

L'une des traductions vous semble-t-elle cohérente ?

Aller à la page de "ORF Finder" du NCBI. Taper le n° d'accession "U91966.1" et lancer l'application.

Rechercher la phase de lecture ouverte la plus cohérente.

Quelle longueur fait-elle en nucléotides et pour combien d'acides aminés code-t-elle ?

  • Frame +2
  • from to 284 ..1744
  • Length 1461

Récupérer la séquence nucléotidique FASTA :

  • cliquer sur le carré vert à côté de "+2"/ cliquer sur "Accept"
  • dans le menu déroulant qui commence par "1 GenBank", choisir "2 Fasta nucleotide" / cliquer sur "View"
  • enregistrer cette séquence FASTA
ORFframe2.fasta

Revenir au programme "Translate".

Coller la séquence FASTA "ORFframe2.fasta" dans la fenêtre et lancer l'application.

  • cliquer sur la bonne phase de lecture
  • cliquer sur la méthionine en position 1
  • cliquer sur le lien "VIRTXXXX in FASTA format"

Enregistrer la séquence FASTA virtuelle générée.

5'3' Frame 1

Virtuelle.fasta

 

Dans une autre page de navigateur, aller à "Pairwise Sequence Alignment". Choisir "Water (EMBOS)".

Que fait ce programme ?

En optimisant les paramètres, aligner la séquence FASTA "RLSAT.fasta" avec la séquence FASTA "Virtuelle.fasta".

Quelle différence y a-t-il entre "RLSAT.fasta" et "Virtuelle.fasta" ?

Finalement à quoi correspond la séquence U91966.fasta ?

"Virtuelle.fasta" est la séquence protéique du précurseur de la grande sous-unité de la RuBisco de Arabidopsis thaliana "RLSAT.fasta".

"U91966.fasta" est la séquence génomique de la grande sous-unité de la RuBisco de Arabidopsis thaliana.

 

Liens Internet et références bibliographiques

ExPASy Proteomics tools : Ensemble d'applications pour l'analyse de séquences peptidiques.

Bioinformatics Databases and Tools Guide : Liste d'un trés grand nombre d'applications bioinformatiques, de bases de données et autres classées par catégories.

Sequence Manipulation Suite : Ensemble d'applications Java pour l'analyse de séquences d'ADN et de protéines.

Site "Ion source" : spectromètrie de masse. Contient aussi des cours et exercices appliqués à la protéomique à faire en ligne. Ion source
"La bioinformatique en protéomique : analyse des spectres de masse" - F. Rechenmann & I. Quinkal Aller au site
"The Plant Proteome Database for Arabidopsis thaliana and Zea mays" PPDB

"ProMEX : Protein Mass spectra EXtraction" : base de données de spectres de masse d'ions obtenue après hydrolyse tryptique et générés par spectrométrie de masse à piège à ion couplée à la chromatographie liquide - Arabidopsis thaliana.

ProMEX
"AMPDB : the Arabidopsis Mitochondrial Protein Database" AMPDB

"Arabidopsis thaliana Seed Proteome" (CNRS - INRA - Bayer)

Seed-proteome

 

Valid XHTML 1.0 Transitional Retour haut de page