Présentation du module de bioinformatique
Gilles Hunault (Statistiques) Site Web
Emmanuel Jaspard (Biochimie) Site Web

La bioinformatique est une discipline à part entière qui utilise un ensemble de techniques et d'outils issus des mathématiques, de la physique et de l'informatique dans le but d'analyser des données biologiques. Ces données biologiques concernent essentiellement deux types de macromolécules : les acides nucléiques et les protéines.

Les énormes volumes de données biologiques ne sont plus susceptibles d'être traités manuellement. Ils nécessitent l'utilisation de l'ordinateur pour le traitement automatique de l'information. Les données biologiques sont regroupées dans un grand nombre de bases de données (généralistes ou spécialisées), utilisables via Internet et le Web.

Les récents progrès des programmes de séquençage des génomes (comme celui du génome Humain dont les brouillons ont été publiés en 2001) ont ouvert des voies dans les domaines de la biologie, de la santé et de l'agronomie.

La génomique s'intéresse à l'étude exhaustive des génomes : elle en analyse la structure afin d'identifier les gènes et les régions qui régulent l'expression de ces gènes. Cette régulation est assurée par la fixation de facteurs de transcription sur des régions particulières des gènes. Il en résulte un très grand nombre d'interactions protéine/ADN et protéine/protéine.

La protéomique étudie l'ensemble des protéines contenues dans une cellule (le protéome). Elle s'articule autour de trois thèmes majeurs : la prédiction de structures, la relation structure-fonction et la phylogénie.

D'autres voies sont en pleine expansion :

  • l'étude des réseaux d'interactions entre molécules (protéine/ADN, protéine/protéine, protéines/substrats, protéines/effecteurs ). Le but est de décrire le fonctionnement global d'une cellule dans un environnement donné.
  • la modélisation moléculaire pour la conception de médicaments et l'étude de l'interaction entre macromolécules.

En conclusion :

  • La bioinformatique permet au biochimiste d'exploiter le formidable potentiel de connaissances contenues dans les banques de données et de les analyser.
  • Elle permet à l'informaticien de mettre en œuvre ses compétences en algorithmique et en programmation, en développement d'interface et de bases de données.
  • Enfin, si l'informatique permet d'accéder aux données, les statistiques permettent d'en décrire le contenu.

Le but de ce module est d'initier les étudiants à la bioinformatique en leur faisant découvrir les connaissances, les techniques et les outils utilisés.

C'est un bon complément des notions abordées dans le module "Génomique fonctionnelle et protéomique".

 

Contenu des enseignements - salles informatique

1. Bases d'Informatique - Matthieu BASSEUR - 8 H [CM / TD]

  • Bases de données, stockage et récupération de l'information
  • Bases théoriques de l'alignement . Alignement multiple
  • Reconstruction phylogénétique
  • Applications

2. Statistiques appliquées à la bioinformatique - Gilles HUNAULT - 8 H [CM / TD]

  • Etude de QT (moyennes, corrélations...) ; application aux longueurs de protéines, aux valeurs d'hydropathie.
  • Etude de QL (comptages, chi-deux...) ; application aux propriétés (présence de pont disulfure, classes d'hydrophobicité...).
  • Tests classique dont anova (études par groupe) ; application à LEAPDB et DBDB.
  • Analyse des données (AFC, ACP, CAH) ; application aux données issues de puces à ADN.

Logiciel utilisé : Excel (peu) et R (beaucoup).

On apprendra aux étudiant(e)s à accorder une attention toute particulière à la rédaction et au choix des graphiques associés aux calculs en fonction du public concerné par l'étude statistique.

3. Bioinformatique appliquée - Emmanuel JASPARD - 12 H [CM / TD]

  • Description des bases de données et des données dans les bases de données (Fichiers GenPept / format Fasta, ...)
  • Recherche de fichiers de protéines - rapatriement de séquences - modification des formats pour l'utilisation de logiciels bioinformatiques
  • Utilisations de programmes d'alignement (Multalin, ClustalW, MAFT, Muscle, ...) - Alignements locaux, globaux - paramétrage des programmes d'alignement
  • Recherche de motifs : peptide signal, signature, famille de protéines, ...
  • Approche bioinformatique en protéomique
  • Théories sous-jacentes aux divers aspects abordés

D'autres ressources utiles sont consultables sur le site Web de Jean-Michel Richer (Informatique).

Valid XHTML 1.0 Transitional