

Pasteur HUB
- Information
- Infrastructure
- Donnees
- Outils
- Expertise
- Formations
- Publications
- Ouverture
- Imports
- Gerer mes utilisateurs
Adresse postale
Structure(s) :
Unité :
Responsable(s) scientifique
Responsable(s) opérationnel
Certificat(s)
Type d'infrastructure
Capacité de stockage
Ferme de calcul
Collection de données
Heure de CPU
Outils bioinformatiques
Nombre d'utilisateurs
Description des serveurs
serveurs :
- 2 noeuds (40 coeurs, 512GB RAM)
- 52 noeuds (12 coeurs, 256GB RAM)
- 163 noeuds (12 coeurs, 64GB RAM)
- 1 noeud GPU-K80 (20 cores, 256 GB RAM, 4xNvidia-K80)
- 2 noeuds GPU-M40 (20 cores, 256 GB RAM, 4xNvidia-M40)
- 2 noeuds GPU-P100 (20 cores, 512 GB RAM, 4xNvidia-P100)
stockage Isilon accessible via NFS
cluster géré via Sun Grid Engine (ou descendants) puis SLURM
programmes bioinformatiques accessible via « module » .
Le détail des données et outils est accessible à l'adresse suivante: https://bioweb.pasteur.fr/
Condition d'accès
accès restreint aux membres de l'Institut Pasteur suaf via les services web (galaxy.pasteur.fr par ex)
![]() Visites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : Non renseignées
Dernière mise à jour : 01-12-2016
Listeriomics : Systems Biology of ListeriaDescriptionListeriomics integrates all complete genomes, transcriptomes and proteomes published for Listeria species to date. It allows navigating among all these datasets with enriched metadata in a user-friendly format. Use Listeriomics for deciphering regulatory mechanisms of your genome element of interest. Conditions d'accèsfreely accessible at http://listeriomics.pasteur.fr/ |
![]() Visites annuelles : 1 757 an
Visites uniques : 441 an
Citations : 51
Dernière mise à jour : 29-01-2016
MacSyDB-TXSSdbDescriptionProtein secretion systems are key virulence factors of all major bacterial pathogens with an LPS-containing outer membrane. They are also involved in complex antagonistic ecological interactions between bacteria. We designed models and protein profiles to detect an unprecedented number and diversity (∼10000) of bacterial protein secretion systems (T1SS, T2SS, T3SS, T4SS, T5SS, T6SSi-iii, T9SS) and evolutionarily related appendages (T4P, Tad, Flagellum) in 1528 genomes of diderm bacteria. ref: Abby, Sophie S., Jean Cury, Julien Guglielmini, Bertrand Néron, Marie Touchon, and Eduardo PC Rocha. "Identification of protein secretion systems in bacterial genomes." Scientific reports 6 (2016). Conditions d'accèsfreely accessible at http://macsydb.web.pasteur.fr/ |
![]() Visites annuelles : 2 955 an
Visites uniques : 1 835 an
Citations : 127
Dernière mise à jour : 22-01-2014
secretonDescription
The http://secreton.web.pasteur.fr/ web site allows to query a dataset of 216 NF-T3SS retrieved from 1385 complete genome sequences. These systems were detected with proteic profiles of NF-T3SS core genes (sctC, sctN, sctJ, sctQ, sctR, sctS, sctT, sctU, sctV), and with an analysis of the genomic context of the hits obtained. This dataset along with the methodology is described in Abby SS, Rocha EPC (2012) The Non-Flagellar Type III Secretion System Evolved from the Bacterial Flagellum and Diversified into Host-Cell Adapted Systems. PLoS Genet 8(9): e1002983. Conditions d'accèsfreely accessible at http://secreton.web.pasteur.fr |
![]() Visites annuelles : 4 633 an
Visites uniques : 2 056 an
Citations : 62
Dernière mise à jour : 22-01-2014
ConjdbDescriptionThis website allows to query a dataset of 947 conjugative systems, 646 non-conjugative T4SS and 1,180 mobilization systems retrieved from 2,269 complete genome sequences. These systems were detected with protein profiles of T4SS components, coupling proteins and relaxases. The hits were then filtered with a criterion of co-localization. This dataset along with the methodology is described in Julien Guglielmini, Bertrand Néron, Sophie S. Abby, María Pilar Garcillán-Barcia, Fernando de la Cruz and Eduardo P. C. Rocha Nucleic Acids Research, 2014 1 doi: 10.1093/nar/gku194 1
Conditions d'accèsfreely available at http://conjdb.web.pasteur.fr/ |
![]() Aucun site web renseignéVisites annuelles : 831 013 an
Visites uniques : 95 031 an
Citations : 4
Dernière mise à jour : 07-01-2015
Genolist serversDescriptionThere are 17 Genolist servers, each server is dedicated to a particular organism. The Genolist servers integrate informations about genome from different origins.
SubtiList : Bacillus subtilis strain 168 GenoList browser Conditions d'accèsAccès libre |
![]() Aucun site web renseignéVisites annuelles : 809 287 an
Visites uniques : 145 an
Citations : 13
Dernière mise à jour : 22-01-2014
Multi-Genome GenolistDescriptionGenoList is an integrated environment for comparative exploration of microbial genomes. The current release integrates genome data for over 700 species (Genome Reviews). The query and navigation user interface includes specialized tools for subtractive genome analysis and dynamic synteny visualization. Conditions d'accèsaccès libre |
![]() Visites annuelles : 1 855 an
Visites uniques : 742 an
Citations : 1
Téléchargements : 127
SHAMAN: a Shiny Application for Metagenomic ANalysisDescriptionSHAMAN is a SHiny application for Metagenomic ANalysis including the normalization, the differential analysis and mutiple visualization. SHAMAN is based on DESeq2 R package [Anders and Huber 2010] for the analysis of metagenomic data, as suggested in [McMurdie and Holmes 2014, Jonsson2016] . SHAMAN robustly identifies the differential abundant genera with the Generalized Linear Model implemented in DESeq2 [Love 2014] . Resulting p-values are adjusted according to the Benjamini and Hochberg procedure [Benjamini and Hochberg 1995]. The PCOA is performed with the ade4 R package and plots are generated with ggplot2 or D3.js packages . Conditions d'accèsthe web server is open and available at http://shaman.c3bi.pasteur.fr/ the code is accessible here https://github.com/aghozlane/shaman and release under the GPLv3 license. |
![]() Visites annuelles : 1 524 an
Visites uniques : 833 an
Citations : 1
Téléchargements : Non renseigné
MEMHDXDescriptionMEMHDX allows users to perfom an automated workflow to analyze, validate and visualize large HDX-MS datasets. The input file is the output of DynamX software from Waters. Output files provide a plot of the data, the fitted model for each peptide, a plot of the calculated p -values, and a global visualization of the experiment. User could also obtain an overview of all peptides on the 3D structure. ref: Véronique Hourdel, Stevenn Volant, Darragh P. O’Brien, Alexandre Chenal, Julia Chamot-Rooke, Marie-Agnès Dillies, Sébastien Brier; MEMHDX: an interactive tool to expedite the statistical validation and visualization of large HDX-MS datasets. Bioinformatics 2016; 32 (22): 3413-3419. doi: 10.1093/bioinformatics/btw420 Conditions d'accèsMEMHDX is freely available as a web tool at http://memhdx.c3bi.pasteur.fr/ |
![]() Visites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : 4
Téléchargements : Non renseigné
SARToolsDescriptionSARTools is a R package dedicated to the differential analysis of RNA-seq data. It provides tools to generate descriptive and diagnostic graphs, to run the differential analysis with one of the well known DESeq2 or edgeR packages and to export the results into easily readable tab-delimited files. It also facilitates the generation of a HTML report which displays all the figures produced, explains the statistical methods and gives the results of the differential analysis. Conditions d'accès |
![]() Visites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : 23
Téléchargements : Non renseigné
IntegronFinderDescriptionIntegronFinder is a program that detects integrons in DNA sequences. The program is available on a webserver (galaxy), or by command line (IntegronFinder on github). Integrons are major genetic element, notorious for their major implication in the spread of antibiotic resistance genes. More generally, integrons are gene-capturing device, whose broader evolutionary role remains poorly understood. IntegronFinder is able to detect with high accuracy integron in DNA sequences. It is accurate because it combines the use of HMM profiles for the detection of the essential protein, the site-specific integron integrase, and the use of Covariance Models for the detection of the recombination site, the attC site. IntegronFinder can also annotate gene cassettes (CDS nearby attC sites) using Resfams, a database of HMM profiles aiming at annotating antibiotic resistance genes. This database is provided but the user can add any other HMM profiles database of its own interest. Conditions d'accèsIntegron_Finder is released under the GPLv3 license and is available here: https://github.com/gem-pasteur/Integron_Finder |
![]() Aucun site web renseignéVisites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : Non renseigné
Téléchargements : Non renseigné
SynTViewDescriptionSynTView is a comparative and interactive viewer for microbial genomes, designed to run as either a web-based tool (Flash technology) or a desktop application (AIR environment). The basis of the program is a generic genome browser with sub-maps holding information about genomic objects (annotations). The software is characterised by the presentation of syntenic organisations of microbial genomes and the visualisation of polymorphism data (typically Single Nucleotide Polymorphisms — SNPs) along these genomes; these features are accessible to the user in an integrated way. A variety of specialised views are available and are all dynamically inter-connected (including linear and circular multi-genome representations, dot plots, phylogenetic profiles, SNP density maps, and more). Documentation, tutorials and demonstration sites are available at the URL: http://genopole.pasteur.fr/SynTView Conditions d'accès |
![]() Visites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : 23
Téléchargements : Non renseigné
macsyfinderDescriptionDetection of macromolecular systems in protein datasets using systems modelling and similarity search. MacSyFinder is a program to model and detect macromolecular systems, genetic pathways in protein datasets. In prokaryotes, these systems have often evolutionarily conserved properties: they are made of conserved components, and are encoded in compact loci (conserved genetic architecture). The user models these systems with MacSyFinder to reflect these conserved features, and to allow their efficient detection. Criteria for systems detection include component content (quorum), and genomic co-localization. Each component corresponds to a hidden Markov model (HMM) protein profile to perform homology searches with the program Hmmer .
Homepage : https://github.com/gem-pasteur/macsyfinder Conditions d'accèsfreely available (GPLv2) |
![]() Visites annuelles : 209 734 an
Visites uniques : 20 399 an
Citations : 239
Téléchargements : Non renseigné
MobyleDescriptionMobyle is a framework and web portal specifically aimed at the integration of bioinformatics software and databanks. Mobyle is the successor of Pise and the RPBS server, previous systems that provided web environments to define and execute bioinformatics analyses. Functionalities:
Based on extensive user studies, we developed the end-user interface as a Web Portal that provides a global and integrated view of all the elements needed to perform analyses, such as the available programs, the submitted jobs and the data of interest. References:Bertrand Néron, Hervé Ménager, Corinne Maufrais, Nicolas Joly, Julien Maupetit, Sébastien Letort, Sébastien Carrere, Pierre Tuffery, and Catherine Letondal Conditions d'accèsThe Mobyle framework is developped under the GPLv2 license. |
![]() Aucun site web renseignéVisites annuelles : Non renseignées
Visites uniques : Non renseignées
Citations : Non renseigné
Téléchargements : Non renseigné
fqtoolsDescriptionfqtools is a package which provides tools to handle efficiently files in FASTAQ format. The following tools are provided : fqduplicate : retrieve duplicated entries fqextract : extract entries fqquality : filter a file according to the quality ftp://ftp.pasteur.fr/pub/gensoft/projects/ Conditions d'accèsaccess : free (GPLv2) |
Domaines d'activité
- Biomédical
- Biologie
Mots clés:
- Analyse de données de séquençage NGS
- Méthodologie
- Assemblage de génomes et transcriptomes
- Alignements de lectures sur des génomes
- Génomique (DNA-seq)
- Analyse de génomes
- Annotation structurale et fonctionnelle des génomes
- Transcriptomique (RNA-seq)
- Analyse différentielle de l’expression des gènes
- Analyses de transcrits et transcrits variants
- Analyse de variants
- Panels (amplicons, captures)
- Exomes
- Génomes complets
- Analyse de la régulation de l’expression des gènes
- Chip-seq
- Petits et longs ARN non-codants
- Profils de méthylation
- Accessibilité de la chromatine
- Analyse de la conformation des chromosomes
- Métagénomique, métatranscriptomique
- Analyse de séquences
- Algorithmique des séquences
- Alignement (multiple) de séquences
- Annotation de séquences
- Recherche de motifs
- Prédiction d'homologie/orthologie
- Apprentissage automatique
- Bioimagerie
- Analyse d’images
- Extraction d’informations
- Quantification
- Visualisation
- Bioinformatique structurale
- Biologie des systèmes
- Biostatistiques
- Statistique descriptive
- Tests statistiques
- Régression
- Analyses multivariées
- Réduction de dimension
- Inférence et analyse des réseaux biologiques
- Statistique génétique
- Cartographie
- Localisation de QTL
- Intégration d'outils
- Interopérabilité
- Interfaces, portails web
- Développement de workflows
- Données
- Intégration de données
- Gestion et transfert de données
- Bases de données et systèmes d’informations
- Environnements de calcul
- Cluster
- GPU
- Parallélisation
- E-learning
- Evolution et phylogénie
- Evolution moléculaire
- Phylogénomique
- Super-arbres et réconciliations
- Détection de sélection
- Génomique comparative
- Comparaison des génomes
- Comparaison des voies fonctionnelles et régulatrices
- Génomique : Puces
- Biopuces ADN
- Biopuces ARN
- Expression
- Tiling
- Analyse des réseaux métaboliques
- Protéomique
- Protéomique quantitative
- Analyse différentielle statistique
Formation professionnelle
![]() Personnes formées : 12 personnes / an
Temps de formation : 5 jour(s) / an
Prochaine session : 14-11-2016
Introduction à la Phylogénie Moléculaire : CONCEPTS, METHODES ET OUTILSDescriptionLe C3BI propose des cours pour acquérir les notions théoriques de phylogénie et maitriser les outils et logiciels.
inscription par mail à formation@pasteur.fr (avec le sujet “Phylogénie Moléculaire”) + formulaire Conditions d'accèsouvert à tous (chercheur,ingénieur, étudiant) mais inscription obligatoire par mail à formation@pasteur.fr (avec le sujet “Phylogénie Moléculaire”) + formulaire |
![]() Personnes formées : 30 personnes / an
Temps de formation : 3 jour(s) / an
Pas de nouvelle session prévue
Initiation à l'analyse de données avec RDescriptionLe cours s’adresse à des personnes qui veulent apprendre ou ré-apprendre à utiliser les statistiques à bon escient pour leurs propres projets. L’objectif est de présenter et expliquer les principales notions de statistiques utiles pour décrire un jeu de données, en explorer les propriétés afin d’en tirer des conclusions robustes, utiliser à bon escient les méthodes les plus courantes (tests d’hypothèse, ACP, …) et savoir lire, interpréter (et éventuellement aborder d’un œil critique) les résultats présentés dans les publications. Nous utiliserons le moins possible le formalisme mathématique mais insisterons sur les propriétés des méthodes, leurs pré-requis, l’interprétation des résultats. Nous aborderons les notions d’analyse exploratoire, ACP, clustering, estimation, échantillonnage, régression, tests d’hypothèse, planification d’expérience Ce cours est une initiation à l’analyse de données. Il est préférable d’avoir une connaissance minimale de R. Dans le cas contraire, un tutoriel d’initiation est disponible sur la page web du cours et les notions de base de R seront rappelées pendant la pratique. Pour les personnes n’ayant jamais utilisé R, il peut être utile d’avoir des connaissances de base en programmation, quel que soit le langage. Les cours seront donnés en Français et alterneront théorie et pratique avec RStudio. Il est demandé à chaque participant de venir avec un ordinateur portable chargé sur lequel il aura préalablement installé les éléments nécessaires (R, Rstudio et les fichiers de données sur lesquels nous travaillerons). La liste complète des fichiers et logiciels nécessaires sera disponible sur la page web du cours une dizaine de jours avant le début de la session.
Conditions d'accèsouvert à tous, sur inscription. |
![]() Aucun site web renseignéPersonnes formées : 12 personnes / an
Temps de formation : 10 jour(s) / an
Pas de nouvelle session prévue
LeiSHield training course on Next Generation SequencingDescriptionThe primary aim of this course was to provide a basic understanding of the Leishmania genome, NGS technology and analysis tools, and to develop a basic pipeline for the students to start working on their data. This first pipeline will help to standardize all analysis done in the consortium and should facilitate a posterior paper publication. This pipeline will evolve Conditions d'accèsbelonging to the Leishield consortium. |
![]() Aucun site web renseignéPersonnes formées : 20 personnes / an
Temps de formation : 11 jour(s) / an
Pas de nouvelle session prévue
Programmation et scriptingDescriptionCe cours s'adresse à toute personne de l'institut Pasteur ou appartenant au réseau international (RIIP) souhaitant acquérir des bases de la programmation et du scripting utiles à la bioinformatique et ayant du mal à trouver du temps pour se former tout le long de l'année.
Conditions d'accèsMembre de l'institut Pasteur ou au réseau international de l'Institut Pasteur (RIIP) |
![]() Personnes formées : 50 personnes / an
Temps de formation : 20 jour(s) / an
Pas de nouvelle session prévue
hands-on NGS courseDescriptionThe aim of this course is to provide students with theory and practical Conditions d'accèsbelonging to the Institut Pasteur International Network (RIIP) and the University of Sao Paulo. |
![]() Personnes formées : 15 personnes / an
Temps de formation : 3 jour(s) / an
Prochaine session : 18-02-2019
Introduction à la phylogénie moléculaireDescriptionLe C3BI propose des cours pour acquérir les notions théoriques de phylogénie et maitriser les outils et logiciels. ** Mardi 29 septembre Conditions d'accèsréservé aux membres de l'Institut Pasteur |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 27-03-2017
COURS PROGRAMMATION SCIENTIFIQUE EN PYTHONDescriptionThe ever growing usage of high throughput technologies in Biology is revolutionizing the life sciences and profoundly changing its practices. Scripting languages are used on a daily basis in life science labs in order to mine huge data sets produced by high-throughput devices. This two-week course will give participants basic knowledge in python and state-of-the-art machine learning methods to analyze their own data sets. Description: This course is intended for PhD students, engineers and research scientists willing to acquire knowledge in scientific programming. Throughout the course, we will use Python language to lead participants from the basics of computer programming to more advanced techniques such as practical machine learning techniques. Conditions d'accèsNon renseigné |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 03-04-2017
Bioinformatics of protein--protein interactions for wet lab scientistsDescriptionUnderstanding physical and functional interactions between molecules in living systems is crucial in many biological processes. Several powerful methods and techniques have been developed to generate molecular interaction data, focusing mainly on protein-protein interactions (PPIs). In particular, PPIs involving partially or completely unstructured regions are building blocks of regulatory and signalling networks that control cell response to external and internal cues. Exploring these interactions may help understanding a protein’s function and behavior, predicting biological processes that a protein of unknown function is involved in, and characterising protein complexes that can be used to modulate or perturb known biological processes and pathways. Conditions d'accèsNon renseigné |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 19-06-2017
« STATIMAGE», Statistiques pour l’imagerie de microscopieDescription
L’objectif de cette formation est de donner aux ingénieurs des plates-formes d’imagerie cellulaire et aux personnes qui utilisent ces technologies, des outils statistiques adaptés aux problématiques du domaine. Dans le but de traiter les grandes séries d’images acquises selon les diverses modalités, il est proposé de renforcer la maîtrise des outils statistiques pour une analyse pertinente mais aussi pour une optimisation des acquisitions.
La formation se déroulera du lundi midi au mercredi après-midi pour 2 demi-journées de cours (rappel des notions de bases, modélisation, plans d’expériences) et 3 demi-journées de travaux pratiques/dirigés. Conditions d'accèsNon renseigné |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 24-10-2017
Linking gene and function, comparative genomics tools for biologistsDescriptionMore than twenty years after the first bacterial genome has been sequenced, microbiologists are faced with an avalanche of genomic data. However the quality of the functional annotations of the sequenced proteome is very poor with more than half of the sequenced proteins remaining of unknown function. After taking this course, students should master an array of web-based tools to help to predict gene function. This will allow them to generate in silico based functional predictions and produce illustration for manuscripts that use comparative genomic methods. For background read (https://www.ncbi.nlm.nih.gov/pubmed/20001958) Conditions d'accèsNon renseigné |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 19-03-2018
Analyse de séquencesDescription
Les biologistes sont régulièrement confrontés à des gènes (ou des protéines) de fonctions inconnues ou mal annotés. Dans ce contexte, maîtriser quelques techniques basiques d’analyse de séquences peut se révéler d’une aide précieuse.
L’objectif de cette formation est de présenter, au travers de l’utilisation de sites web spécialisés, quelques grands principes sur l’analyse de séquence. L’ensemble de la formation combine exposés théoriques (fondements méthodologiques des programmes) et applications pratiques (mise en relation des notions théoriques avec les paramètres des programmes et les résultats obtenus) pour permettre une utilisation autonome et critique de quelques logiciels d’analyse des séquences biologiques. Conditions d'accèsNon renseigné |
Formation universitaire
![]() Personnes formées : 20 personnes / an
Temps de formation : 30 jour(s) / an
Prochaine session : 05-11-2018
Cours Pasteur Analyse des GénomesDescriptionChaque année, ce cours théorique et pratique d’une durée de sept semaines fait le tour Conditions d'accèsNon renseigné |
![]() Personnes formées : 15 personnes / an
Temps de formation : 10 jour(s) / an
Prochaine session : 11-02-2019
Rôles multiples de l’ARNDescriptionCe cours théorique et pratique de deux semaines est orienté sur les méthodes pour étudier la synthèse, maturation et la dégradation d’une large variété de molécules d’ARN dans les cellules eucaryotes - voir plus Conditions d'accèsLes candidats doivent avoir de bonnes connaissances en génétique, biologie moléculaire et biochimie du niveau de la fin de première année de Master, ainsi qu’un niveau minimum (B1) en français ET en anglais. Les candidatures sont sélectionnées et évaluées par le Comité du cours.
|
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 14-01-2019
INTRODUCTION À L'ANALYSE DE DONNÉESDescription
L'utilisation de plus en plus répandue de techniques d’imagerie et de séquençage à haut-débit en biologie est en train de révolutionner les sciences du vivant et de modifier en profondeur leurs pratiques. Dans ce contexte, des outils statistiques sont développés pour permettre d’analyser ces données de hautes dimensions, et la maîtrise de ces outils devient de plus en plus nécessaire pour produire des résultats de bonne qualité. Ce cours de 4 semaines couvrira les étapes nécessaires pour mettre en place un processus d’analyse de données, depuis la planification de l’expérience jusqu’à la fouille des données en passant par l’échantillonnage, les test d’hypothèses, la modélisation statistique etc.
Ce cours s’adresse en priorité aux étudiants de première année de thèse de l’Institut Pasteur. Tout étudiant en thèse sera automatiquement inscrit à ce cours, mais les élèves de 2e année, de 3e année ou les post-doctorants peuvent également s’inscrire, dans la limite des places disponibles. Il est à noter que le cours est obligatoire pour les étudiants de 1ère année. Des dispenses partielles ou totales sont possibles pour les étudiants qui ont déjà des connaissances en statistique, en mathématique ou en physique. Le cours déroulera sur 4 semaines, 4 jours par semaine, trois heures par jour. Chaque séance de trois heures alternera cours magistral et mise en pratique. Il y aura deux sessions : la première commencera le 22 octobre 2018 et la deuxième le 14 janvier 2019. Chacune de ces deux sessions sera précédée d’une séance d’introduction à l’informatique. Cette séance proposera des notions d’architecture de l’ordinateur, de système d’organisation des fichiers et de format de fichiers. Chaque session sera également suivie d’un cours optionnel sur l’analyse et le traitement des images. Pour plus d’information, ainsi que pour les inscriptions au module optionnel et les demandes d’exemption, rendez-vous sur la page du cours : https://c3bi.pasteur.fr/introduction-to-data-analysis-2018-19/ Thèmes abordés Le module d’analyse de données couvrira un large champ de notions nécessaires aux étudiants pour planifier leurs expériences, analyser et explorer leurs données, interpréter les résultats et générer des figures à des fins de publication. Il abordera des notions de base en statistique, dont les analyses uni- et multivariées, les analyses descriptives, les distributions statistiques usuelles utilisées en biologie, ainsi que les tests d’hypothèses. Les exercices et travaux pratiques seront réalisés avec R et RStudio. Plusieurs séances seront consacrées à une introduction à l’utilisation du langage de programmation R avant d’aborder les notions de statistiques et d’analyse de données. Le module d’analyse d’images introduira les principes de base de l’analyse d’image, et portera plus particulièrement sur l’extraction d’information quantitative d’images de microscopie. Ce cours est destiné aux personnes ayant peu ou pas d’expérience en analyse d’image. Il sera très orienté sur la pratique : des cours magistraux de courte durée seront immédiatement suivis de sessions pratiques. Il aidera à la fois les microscopistes débutants et experts qui n’ont jamais eu de formation concrète en analyse d’image. Conditions d'accès |
![]() Personnes formées : Non renseigné
Temps de formation : Non renseigné
Prochaine session : 08-10-2018
Data analysisDescriptionBiological data are often complex and challenging to analyse due to non-normal distributions, nonlinear relationships, spatial/temporal structures and high dimensionality. This course will introduce the students to key concepts and statistical tools for the experimental design and analysis of biological data. After a brief refresher on basic elements of statistics, the students will be made familiar with hypothesis testing, univariate statistical tests (e.g. ANOVA), linear models, descriptive multivariate analyses such as Principal Component Analysis (PCA) and clustering. The course will alternate theoretical aspects and computer exercises on small datasets with the R Studio software. The students will be assigned a small project involving the different concepts and tools covered by the course. Conditions d'accèsNon renseigné |
Publications internes
Publications externes
Publications avec le laboratoire d'hébergement
Répartition des utilisateurs
Description de la répartition :
This statistics are based on the provenance of Mobyle Jobs
Projets propres de la plateforme
Aucun (ou non renseigné)
Collaborations
Projets d'ANR
Projets européens et internationaux
- Work Package 1: "Tools Interoperability and Service Registry".
- Work Package 4: "Compute, Data access and exchange services"
Projets avec des industriels
Projets de collaboration non financés par un organisme extérieur
Prestations de service non financés par un organisme extérieur
Animations
In 2016
Seminars
- The schedule of the next events is available here: https://c3bi.pasteur.fr/meetings/
- The abstracts of the former events are available here: https://c3bi.pasteur.fr/seminars-former-events/
Hackathons
Resource Hackathon : de.NBI EDAM Codefest (Jan 19-20 2016, Freiburg Uni., DE)
http://tinyurl.com/registryhackathon7
This hackathon, organised by University of Freiburg, will focus on 1) annotation of de.NBI tools and services, 2) ELIXIR Registry and registration process and 3) Publishing tools in the ELIXIR Registry.
Resource Hackathon : bio.tools @ Debian Med Sprint (Feb 4-7 2016, Lyngby, DK)
https://wiki.debian.org/Sprints/2016/DebianMed2016
Co-located with the Debian Med sprint: a resource hackathon focussed on curation and software development towards annotation and registration of tool packages from Debian Med.
http://tinyurl.com/registryhackathon6
A hackathon bringing together representatives of French bioinformatics communities with the ELIXIR Tools & Data Services Registry, dedicated to the description and cataloguing of French tools and services, to boost their discovery and utility.
http://tinyurl.com/registryhackathon8
A hackathon bringing together developers from key technical projects from ELIXIR and beyond including: the ELIXIR Tools & Data Services Registry (bio.tools), workbench/workflow projects (CWL, Galaxy, Taverna, Arvados), bioinformatics container solutions and registries, and the EDAM ontology.
https://c3bi.pasteur.fr/news-journee-snakemake/
The day was a great opportunity for about 50 participants to learn about Snakemake, have high-level discussions about the syntax and usage, and to participate to some focus groups.
Schools
https://www.france-bioinformatique.fr/fr/cloud/formation-FG
http://www.france-bioinformatique.fr/fr/evenements/EBA2016
In 2015
Technical Hackathon 2 : EDAM development heuristics (Dec 1-4 2015, Amsterdam, Netherlands)
tinyurl.com/registryhackathon5
This hackathon aimed at preparing EDAM for scaling with registry growth. The focus was to enumerate EDAM development heuristics to ensure usability, identify desirable clean-ups, and to devise quality assurance methods, including usability benchmarking in different scenarios. It also included a thematic session focussing on protein structural biology and the WHAT-IF package.
Curation Hackathon 2 (Nov 4-6 2015, Brno, Czech Republic)
tinyurl.com/registryhackathon3
The second in the series, will aim for representation in the registry of all ELIXIR nodes, including new partners from Spain, Netherlands, Sweden and Finland, and other key resources beyond ELIXIR.
Thematic Hackathon 2 : RNA analysis (Sep 23-25 2015, Copenhagen, DK).
A thematic hackathon focussed on RNA analysis and seeking to establish an ELIXIR RNA Tools Consortium that the Registry can draw upon in the future.
Thematic Hackathon 1 : defining good practice for resource annotation and registry curation (Aug 2015 23-25, Tallin, EE).
tinyurl.com/registryhackathon4
A three day workshop organised and financed by ELIXIR-EE aiming to identify relevant processes and good practice for the annotation and curation of resources for their integration into the emerging ELIXIR infrastructure, focussed on next generation sequencing (NGS) analysis and the SeqWIKI Resource Hub.
Technical Hackathon 1 - EDAM Development & Governance (Mar 2015, Lyngby, DK)
tinyurl.com/registryhackathon2
Focused on EDAM technical maintenance and usability, and produced a mock-up of tooling to assure optimal usage of EDAM for registry curation.
Participation to the G4B course
- at La Chapelle-sur-Erdre with the IFB-Galaxy working group (3 to 5 Mar. 2015)
- at Toulouse with the IFB-Galaxy working group (2 to 5 Nov. 2015)
co-organizer and host of the hackathon and Galaxy Days, (Institut Pasteur, 18, 19 Nov. 2015)
Participation to the France Génomique WP2.5 « Niveaux d'expression »