HAV815V Analyse pratique de données de génomique en R – Practical Analysis of Genomic Data Using R

Responsable

Jacques Colinge

Crédits : 5 ECTS

Objectifs

La recherche et les applications industrielles en biologie moléculaire recourent de plus en plus souvent aux techniques de génomique à haut débit. Par ailleurs, de grandes collections de données publiques de ce type peuvent profiter à de nouveaux projets à condition de savoir les intégrer. Il existe bien des outils logiciels et des sites internet mais fréquemment on a besoin d’analyses particulières ou de représentations graphiques qui ne sont pas disponibles.

Pour répondre à ce type de besoin, une plateforme s’est très largement imposée : R et Bioconductor. R est un langage de programmation et un environnement de travail interactif et Bioconductor un ensemble de librairies pour les problèmes de bioinformatique.

Objectives

Practical analysis of genomic data using R

Academic as well as industrial research in molecular biology often involves high-throughput genomic technologies. Furthermore, large data collections of this type are publicly available, which can benefit new projects provided they can be integrated. Software tools and web sites exist that can perform some common analyses but frequently, specific analyses or graphical representations are needed, which are not offered.

To address this need, a platform has emerged and is widely used:

R and Bioconductor. R is a programming language and an interactive environment to analyze and explore data, and Bioconductor is an ensemble of R libraries to cover many bioinformatics problems.

Description

Cette nouvelle UE optionnelle vous permettra de devenir autonome en apprenant les bases de R et leurs applications en génomique. Nous apprendrons les rudiments du langage, l’exploration graphique des données, le traitement de données courantes comme les transcriptomes et les protéomes, l’intégration de données et quelques éléments concernant les interactomes (réseaux d’interaction). Le cours vous permettra d’appréhender des analyses classiques dont de nombreux laboratoires ont besoin et d’apprendre par vous-même d’autre part.

Ce cours introduira et utilisera des concepts de statistique mais ce n’est pas un cours de statistique. Il ne fera pas de vous des bioinformaticiens mais des biologistes pouvant travailler de manière indépendante et pertinente sur des données de génomique. Si vous avez des bases en math/statistique et/ou programmation, vous en profiterez mais ce n’est pas nécessaire. Le cours est autosuffisant mais en cas de succès nous prolongerons avec un cours plus avancé en M2 introduisant davantage de R, la modélisation, la biologie des systèmes et l’analyse des génomes.

Description

Lectures will allow you to become autonomous by learning the basics of R and their applications in genomics. We will learn R language elements, graphical data exploration, common data processing such as transcriptomes or proteomes, as well as some elementary notions regarding interactomes. You will learn how to handle classical analyses that are necessary for many labs and most importantly to search for information and learn by yourself.

We will introduce and use some concepts of statistics (P-values, Q-values, etc.) but this lecture is not a statistics lecture. It will also not turn you into bioinformaticians but rather into biologists who can deal with basic analyses of genomic data. Any knowledge in mathematics, statistics or programming is an advantage but not a pre-requisite for this course.

Observation

UE ayant lieu en février et jusqu’à mi-mars, sur 6 semaines, deux demi-journées par semaines

Modalités de contrôles des connaissances

Écrit 50%

TD 50%