

Cette formation est dédiée à l'analyse de données de type "métagénomique amplicon" issues des technolo-gies de séquençage 454 et Illumina. La formation couvre les grandes étapes d'un pipeline d'analyse bioinformatique sous Galaxy (FROGS) pour transformer les séquences en tables d'abondances puis présente des outils statistiques sous R (phyloseq) qui permettent de décrire et comparer les échantillons à partir de ces tables.
Programme
Jours 1 et 2 : Analyses Bioinformatiques sous Galaxy
- Introduction générale
- Brefs rappels sur l'environnement Galaxy
- Présentation des données issues des différentes technologies de séquençage
- Prétraitement des données
- Clustering des séquences, construction des OTUs
- Détection de chimères
- Annotation taxonomique
- Filtrage des données de comptages
- Outils de visualisation
- Construction de workflow et configuration de FROGS
- Limite des données et des méthodes
Jour 3 et 4 : Analyses Statistiques sous Rstudio
- Introduction générale
- Import, manipulation et visualisation des données
- Mesure de diversités : Unifrac, Bray-Curtis, etc.
- Ordination et réduction de dimension : MDS
- Clustering et Heatmap
- Comparaison d'échantillons : PERMANOVA, adonis
▫ Introduction générale
▫ Brefs rappels sur l'environnement Galaxy
▫ Présentation des données issues des différentes technologies de séquençage ▫ Prétraitement des données
▫ Clustering des séquences, construction des OTUs
▫ Détection de chimères
▫ Annotation taxonomique
▫ Filtrage des données de comptages
▫ Outils de visualisation
▫ Construction de workflow et configuration de FROGS
▫ Limite des données et des méthodes
- ▫ Introduction générale
- ▫ Import et manipulation des données
- ▫ Mesure de diversités : Unifrac, Bray-Curtis, etc.
- ▫ Ordination et réduction de dimension : MDS
- ▫ Clustering et Heatmap
- ▫ Comparaison d'échantillons : PERMANOVA, adonis
Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.