biologie

Logiciels (logiciels libres en majorité) ou ressources (liées aux logiciels) utiles aux chercheurs et enseignants en biologie
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 29/04/10
  • Correction mineure : 14/02/11
Mots-clés

REPET : annotation des éléments transposables (génomique)

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : 1.3.12.1 - 31/12/2010
  • Licence(s) : CeCILL
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Francoise Alfama Sandie Arnoux Delphine Autard Benoit Bely Marc Bras Elodie Duprat Gael Faroux Timothee Flutre Claire Hoede Olivier Inizan Hadi Quesneville Dorothee Valdenaire
  • Contact concepteur(s) : urgi-repet@versailles.inra.fr
  • Laboratoire(s), service(s)... : URGI

 

Fonctionnalités générales du logiciel

De plus en plus de génomes sont actuellement séquencés dans leur intégralité. Les éléments transposables (ETs) ayant un impact important sur la biologie des génomes, il est indispensable de les identifier. Dans ce but, le package REPET déploie deux pipelines, TEdenovo et TEannot, dédiés à la détection, l'annotation et l'analyse de ces répétitions. Afin d'améliorer la sensibilité de la procédure, ces pipelines combinent plusieurs outils tout en réconciliant leur résultats.

  • Identification des familles d'ETs par une approche de novo: le pipeline TEdenovo commence par aligner le génome contre lui même. Dans un deuxième temps il clusterise les matches puis il construit pour chaque cluster un alignement multiple à partir duquel est obtenue une séquence consensus. Finalement les consensus sont classifiés sur la base de leur caractéristiques d'ETs et la redondance est enlevée.
  • Annotation des copies d'ETs: le pipeline TEannot permet, à partir d'une banque de référence d'ETs, (les consensus issus du TEdenovo par exemple) d'identifier les copies de ces éléments dans le génome. Un filtre statistique empirique permet d'enlever les faux-positifs et les mini-satellites sont également annotés. Une fois les fragments d'ETs identifiés, ceux appartenant à une même copie sont connectés via programmation dynamique ainsi que par une procédure prenant en compte l'âge des éléments.
  • REPET est développé en Python et C++. Afin de gérer de grand volume de données, il interagit fréquemment avec une base de données MySQL et le gestionnaire de cluster SGE.
Contexte d’utilisation du logiciel

Ce package est utilisé dans un contexte de recherches menées sur la dynamique des génomes.

Publications liées au logiciel

Flutre T, Duprat E, Feuillet C, Quesneville H (2011)
Considering transposable element diversification in de novo annotation approaches.
PLoS ONE 6(1): e16526. doi:10.1371/journal.pone.0016526

Combined Evidence Annotation of Transposable Elements in Genome Sequences, Quesneville et al. Plos Computational Biology.
http://www.ploscompbiol.org/article/info:doi/10.13...

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 21/04/10
  • Correction mineure : 21/04/10
Mots-clés

GraMoFoNe : un plugin pour Cytoscape

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 0.1 - 30/03/2010
  • Licence(s) : GPL
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Florian Sikora
  • Contact concepteur(s) : sikora @ univ-mlv.fr
  • Laboratoire(s), service(s)... : LIGM

 

Fonctionnalités générales du logiciel

GraMoFoNe (Graph Motif For Networks) est un plugin pour le logiciel Cytoscape Fiche Plume. Cytoscape est une plateforme open-source pour la visualisation et l'analyse de réseaux biologiques qui autorise le développement de plugin pour enrichir ses fonctionnalités.

Notre plugin cherche une occurrence connexe d'un motif (ensemble ou multi-ensemble de protéines) donné par l'utilisateur, dans un réseau d'interaction protéine-protéine chargé dans Cytoscape (un grand nombre de formats est supporté). La similarité est mesurée par une analyse de séquence via blastp. Les protéines du motif ont différentes couleurs, les protéines du réseau sont colorés par les couleurs des protéines du motif avec lesquelles elles sont homologues.

Précisons qu'un nœud du réseau peut avoir 0, 1 ou plusieurs couleurs. GraMoFoNe autorise les délétions (des protéines qui étaient dans le motif mais qui sont absentes du résultat), et les insertions (des protéines dans le résultat qui étaient absentes du motif) des nœuds colorés ou non.

Contexte d’utilisation du logiciel

Implémentation pour un problème algorithmique connu dans un environnement largement utilisé par la communauté.

Publications liées au logiciel

Guillaume Blin, Florian Sikora, and Stéphane Vialette. GraMoFoNe: a Cytoscape plugin for querying motifs without topology in Protein-Protein Interactions networks. In, Hisham Al-Mubaid, editors, 2nd International Conference on Bioinformatics and Computational Biology (BICoB'10). Honolulu, USA. 24-26 March 2010. pp. 38?43.International Society for Computers and their Applications (ISCA). Note: hal-00425661

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 20/04/10
  • Correction mineure : 12/04/12
Mots-clés

Mobyle : framework pour intégrer les logiciels bioinformatiques

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, MacOS X
  • Version actuelle : 0.97 - 20/11/2009
  • Licence(s) : GPL, LGPL
  • Etat : validé (au sens PLUME), diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Bernard Caudron, Nicolas Joly , Sandrine Larroudé, Catherine Letondal , Corinne Maufrais , Hervé Ménager , Bertrand Néron ( Institut Pasteur, Logiciels et Banques de Données ) , Pierre Tufféry, Julien Maupetit ( Ressource Parisienne en Bioinformatique Structurale).
  • Contact concepteur(s) : mobyle-support[at]pasteur.fr
  • Laboratoire(s), service(s)... : GenOuest, Institut Pasteur, IRISA, LIPM, RPBS

 

Une fiche logiciel décrit plus en détail ce développement, consultez la pour plus d’informations : Mobyle
Fonctionnalités générales du logiciel

Mobyle est un framework permettant l'exécution de logiciels de bioinformatique par l'intermédiaire d'un portail web.

À partir de fichiers XML décrivant chacun des logiciels mis à disposition (BLAST ou Clustal par exemple), une interface web est générée automatiquement au sein du portail web.

Cette interface permet aux utilisateurs de lancer les analyses bioinformatiques sur leurs données, via une interface web, et sans avoir à installer les logiciels et données nécessaires sur leur poste de travail.

L'accent est mis sur la réutilisation des données entre les différents logiciels grâce au typage de ces données. Chaque donnée envoyée sur le portail ou produite par un logiciel (par exemple : séquence d'ADN) est disponible pour tous les logiciels du portail capables de traiter des données de ce type. Ceci permet d'enchaîner les traitements directement sur le portail.

Contexte d’utilisation du logiciel

Mobyle est installé sur (au moins) 4 sites français : Institut Pasteur, RPBS, LIPM et GenOuest.

En ce qui concerne la plateforme GenOuest, son utilisation permet de mettre à disposition rapidement de nouvelles applications (en plus de celles déjà disponibles) dans un portail intégré. La mise en ligne d'un logiciel prend en général quelques dizaines de minutes.

Du point de vue des utilisateurs, le portail web a l'avantage d'être un environnement de travail permettant d'enchaîner les analyses de façon simple et assez conviviale. À condition bien sûr de traiter une quantité raisonnable de données (limitation commune à toutes les interfaces web).

Publications liées au logiciel
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 06/04/10
  • Correction mineure : 11/03/11
Mots-clés

Bio++ : ensemble de bibliothèques C++ dédiées à la bioinformatique

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 2.0 - 08/02/2011
  • Licence(s) : CeCILL
  • Etat : diffusé, stable, diffusé en beta, en développement
  • Support : maintenu, développement en cours
  • Concepteur(s) : Éric Bazin, Khalid Belkhir, Bastien Boussau, Guillaume Deuchst, Julien Dutheil, Sylvain Gaillard, Nicolas Galtier, Sylvain Glémin, Manolo Gouy, Mathieu Groussin, Laurent Gueguen, Benoît Nabholz, Vincent Ranwez, Nicolas Rochette, Céline Scornavacca
  • Contact concepteur(s) : voir sur le site
  • Laboratoire(s), service(s)... : GenHort, ISEM, LBBE, LIRMM, Bioinformatics Research Centre (université d'Aarhus), Evolutionary biology centre (université d'Uppsala)

 

Fonctionnalités générales du logiciel

Bio++ est un ensemble de bibliothèques C++ dédiées à :

  • l'analyse de séquences,
  • la phylogénie,
  • l'évolution moléculaire,
  • la génétique des populations.

Bio++ propose un ensemble cohérent d'objets C++ aux développeurs d'applications bioinformatiques. Ces objets sont à la fois faciles à utiliser du point de vue développeur et optimisés du point de vue machine.

Contexte d’utilisation du logiciel

Bio++ est utilisé par différents logiciels, notamment :

  • bpp-suite : une suite de logiciels dont bppML, un logiciel de calcul de maximum de vraisemblance et d'optimisation d'arbres
  • CoMap : un logiciel de détection de coévolution au sein de séquences
  • ConTest : un logiciel détectant les sites sous contraintes biochimique au sein de protéines
  • détection de polymorphisme nucléotidique
  • ...

Publications liées au logiciel
  • Dutheil J, Boussau B. Non-homogeneous models of sequence evolution in the Bio++ suite of libraries and programs. BMC Evol Biol. 2008 Sep 22;8(1):255
  • Dutheil J, Gaillard S, Bazin E, Glémin S, Ranwez V, Galtier N, Belkhir K. Bio++: a set of C++ libraries for sequence analysis, phylogenetics, molecular evolution and population genetics. BMC Bioinformatics. 2006 Apr 4;7:188
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 31/03/10
  • Correction mineure : 14/11/11
Mots-clés

S-MART : analyse de données de séquençage haut-débit

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 1.0.15 - 10/10/11
  • Licence(s) : CeCILL
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Matthias Zytnicki
  • Contact concepteur(s) : matthias.zytnicki@versailles.inra.fr
  • Laboratoire(s), service(s)... : URGI

 

Fonctionnalités générales du logiciel

S-MART permet tout d'abord de traiter et sélectionner les données issues d'expériences RNA-Seq ou ChIP-Seq avec :

  • La sélection par rapport à un jeu de référence (garder toutes les lectures chevauchant des gènes d'intérêt).
  • L'exclusion par rapport à un ensemble de données (éliminer toutes les lectures chevauchant des ARN de transfert, qui polluent généralement les données).
  • La fusion des lectures en "clusters".
  • L'analyse comparative dans deux conditions différentes.

S-MART peut aussi créer des graphiques afin de visualiser les données avec :

  • La taille des lectures.
  • La répartition sur le génome.
  • La distance par rapport à un jeu de références.

S-MART peut de plus effectuer une recherche d'éléments différentiellement exprimés, et comparer des données d'expression avec d'autres types de données (notamment ChIP-seq).

S-MART peut être utilisé en ligne de commande ou par une interface graphique.

Contexte d’utilisation du logiciel

Les récentes techniques de séquençage ont permis à la majorité des laboratoires de réaliser pour un coût abordable de nouvelles expériences de séquençage haut-débit. S-MART permet d'analyser rapidement sur un ordinateur personnel des millions de lectures issues du séquençage.

S-MART a été testé sur un PC standard avec 4 Go de RAM, cadencé à 3 GHz, sur des données 454 et Solexa (jusqu'à 20 millions de séquences). Il accomplit la plupart des tâches en moins d'une heure, et jusqu'à une journée pour les calculs les plus difficiles. Le passage à l'échelle ne devrait pas poser de problèmes.

S-MART utilise plusieurs logiciels gratuits et facilement téléchargeables : Python, Java et R.

Publications liées au logiciel

Accepté dans PLoS One.

Fiche logiciel validé
  • Création ou MAJ importante : 02/05/13
  • Correction mineure : 02/05/13
Mots-clés

MACS : logiciel d'analyse ChIP Seq (biologie)

  • Site web
  • Système : UNIX-like, Windows
  • Téléchargement
  • Version évaluée : 1.4.2 (facteurs de transcription) et 2 (domaines)
  • Langue(s) de l'interface : anglais
  • Licence : Autre

    Licence artistique.
    Please cite "Zhang et al. Model-based Analysis of ChIP-Seq (MACS). Genome Biol (2008) vol. 9 (9) pp. R137".

Description
Fonctionnalités générales

MACS est un logiciel qui permet principalement d'identifier les inter-actions des protéines avec l'ADN ou des marques d'histones à partir des données obtenues par séquençage haut-débit (ChIP Seq) avec ou sans référence.

Deux versions sont actuellement disponibles :

  • 1.4.2 pour la recherche de facteurs de transcription.
  • 2.0 pour la recherche de pics plus larges, tels que pour les marques d'histones (H3K27me3) ou la RNA Polymerase par exemple.
Autres fonctionnalités

MACS modélise localement le signal en l'approximant via une loi de Poisson, puis calcule la probabilité d'avoir par chance un nombre de "reads" supérieur à celui induit par le modèle. L'algorithme utilise un mécanisme de fenêtres glissantes :

  • Si une référence est fournie ("two samples") ce modèle est calculé sur le contrôle dans des fenêtres de 1kb, 5kb et 10kb, ainsi que sur l'ensemble du génome.
  • Si aucune référence n'est fournie ("one sample") ce modèle est calculé dans des fenêtres de 5kb et 10kb, ainsi que sur l'ensemble du génome.

Dans les 2 cas, la fenêtre choisie est la fenêtre proposant la densité de "reads" (paramètre lambda de la loi de Poisson) la plus élevée.

Dans le cas d'une expérience avec référence, MACS normalise les signaux. Pour les rendre comparables, il amplifie ou diminue linéairement les "reads" obtenus afin d'obtenir un "coverage moyen" équivalent.

L'utilisateur peut faire varier différents paramètres. Citons par exemple la stringence de détection des pics (option --pvalue), la taille du génome que MACS va considérer (--gsize, qui fait varier le paramètre de la loi de Poisson globale), la taille des fenêtres pour le calcul de la densité locale des "reads" (--lambdaset), etc... Ils permettent d'affiner la détection des pics en fonction du profil du signal brut.

L'utilisateur obtient ensuite, pour chaque pic prédit, sa position, son sommet, la p-value associée, le "fold enrichment" (nombre de "reads" du pic rapporté à la densité calculée localement), et le "FDR" (taux de découverte des faux positifs) dans le cas où une référence est fournie. Il est également possible d'obtenir des fichiers permettant de visualiser la distribution de la densité des "reads".

Interopérabilité

MACS prend au choix en entrée plusieurs types de fichiers :

  • Formats de sortie ELAND (logiciel d'alignement propriétaire d'Illumina ® ELAND, ELANDMULTI, ELANDMULTIPET, ELANDEXPORT)
  • Format SAM
  • Format BAM
  • Bowtie
  • Format BED (6 colonnes)

En sortie, MACS propose la sortie des données normalisées sous format wig ou BedGraph.

Contexte d'utilisation dans mon laboratoire/service

MACS est utilisé à l'Institut de Génétique Humaine dans le cadre d'analyses ChIP Seq avec contrôle.
Le choix s'est porté sur MACS car il se révélait plus sensible que Cisgenome dans la détection des pics dans le cadre d'une expérience avec référence pour le type d'application étudiée.
Il est également utilisé sur la plateforme de services en génomique MGX à Montpellier.

Limitations, difficultés, fonctionnalités importantes non couvertes
  • Ce logiciel ne possède pas d'interface graphique proposé par le site web du logiciel et nécessite d'écrire des scripts. Il est donc destiné à être utilisé par des bioinformaticiens et non des biologistes. Cependant, la dernière version de Galaxy intègre MACS en tant que service web.
  • La détection de pics est moins efficace si l'on n'utilise pas de référence.
Environnement du logiciel
Plates-formes

Python (>=2.6.5)

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

Laboratoire Liu Lab
Department of Biostatistics and Computational Biology
Dana-Farber Cancer Institute, Harvard School of Public Health
http://liulab.dfci.harvard.edu/

Eléments de pérennité
  • Le logiciel a des mises à jour régulièrement.
  • Les utilisateurs participent et collaborent au développement.
Références d'utilisateurs institutionnels
  • Institut de Génétique Humaine
  • Institut de Génomique Fonctionnelle
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur
Contributions
Fiche logiciel validé
  • Création ou MAJ importante : 04/10/11
  • Correction mineure : 18/11/13
Mots-clés

Galaxy : plateforme pour analyser les données génomiques

Description
Fonctionnalités générales

Galaxy est une plateforme qui propose une "constellation" d'outils pour analyser, manipuler et visualiser des données génomiques, sans avoir besoin de connaissance en programmation. Elle est développée par The Center for Comparative Genomics and Bioinformatics
L'utilisateur peut réaliser 4 grands types d'opérations :

Manipulation de fichiers:

  • Ouvrir un fichier de plusieurs millions de lignes (là où les tableurs classiques ne le permettent pas)
  • Ajouter ou supprimer des colonnes
  • Supprimer des lignes d'un fichier
  • Filtrer les fichiers sur différents critères
  • Trier les fichiers
  • Concaténer plusieurs fichiers
  • Concaténer des colonnes d'un même fichier ensemble
  • Regrouper plusieurs fichiers dans un seul fichier en colonnes
  • Comparer des listes entre elles (intersection)
  • Faire des conversions de fichiers (par exemple transformer un fichier BED en un fichier GFF)
  • Transformer les délimiteurs du fichier en tabulation (par exemple transformer un ';' en '\tab')

Opérations sur les données:

  • Sommer, moyenner, soustraire
  • Réaliser différentes opérations sur des fichiers fasta (calculer la longueur des séquences, formater la longueur des lignes, convertir des séquences ARN en ADN)
  • Créer ses propres intervalles génomiques pour servir à des analyses
  • Réaliser différentes opérations sur les intervalles génomiques (merge, intersection, soustraction, complément)
  • Calculer la couverture d'une région déterminée

Analyse de séquences:

  • Calculer des corrélations
  • Trouver des orthologues
  • Utiliser les outils d' EMBOSS
  • Aligner les données de séquencage (bowtie)
  • Déterminer des "pics" (par exemple MACS pour de la ChipSeq)

Visualisation des données:

  • Afficher les données dans un génome browser (UCSC, Ensembl)
  • Générer des graphes sur les distributions des données (histogramme, scatterplot)
  • Afficher des alignements multiples

Chaque service est décrit et très souvent des exemples explicitent le résultat renvoyé par la fonction concernée.

Galaxy propose de plus en plus d'outils pour manipuler et analyser les données de NGS (séquenceurs nouvelle génération) ce qui en fait un outil incontournable.

Autres fonctionnalités
  • Créer un compte permet d'avoir un espace de stockage personnalisé et garder l'historique des opérations et les fichiers téléchargés
  • Il est possible de partager ses données et les opérations réalisées : soit à toutes les personnes ayant un compte dans l'instance de Galaxy, soit en créant un lien et en diffusant ce lien, soit en spécifiant les personnes autorisées à voir les données. Cette option est très pratique
  • Passer certaines colonnes de minuscules à majuscules
  • Sélectionner les premières ou dernières lignes d'un fichier
  • Sélectionner des lignes qui correspondent à une expression particulière (exemple c1='chrUn')
  • "Mapper" des séquences sur une séquence de référence
  • Construction d'arbres phylogénétiques
  • Manipulation de fichier de format gff
  • Possibilité de faire un workflow des opérations et fonctionnalités faites
  • Pour les développeurs: possibilité d'intégrer facilement nos propes outils développés (exemple: calcul du pourcentage de GC dans une séquence)
Interopérabilité

Peuvent être utilisés:

Contexte d'utilisation dans mon laboratoire/service
  • Ce logiciel est utilisé par tous les utilisateurs de la plateforme MGX pour manipuler les données de séquençage.
  • Cet outil est aussi utilisé pour manipuler les informations contenues dans un fichier, de façon simple et rapide.
  • Les fonctionnalités de "mapping" des séquences, et d'analyse des régions de variation ("indel", substitution) sont aussi utiles.
  • La construction de worflow résumant l'ensemble des fonctionnalités utilisées est très demandée.
  • Grâce à la possibilté d'y intégrer nos propres outils (outils très utiles et fréquemment utilisés), ce logiciel peut devenir une véritable boite à outils.
Limitations, difficultés, fonctionnalités importantes non couvertes
  • Le logiciel propose beaucoup de services: il faut donc passer du temps pour exploiter pleinement le logiciel.
  • Les fichiers peuvent être volumineux. Il est possible de télécharger un fichier zippé, mais ce fichier une fois téléchargé sur le serveur est dézippé.
Environnement du logiciel
Plates-formes
Logiciels connexes

UCSC, gratuit pour les académiques, payant pour un usage commercial. (Licence).
Ensembl , (Licence)
BioMart
FlyMine
EncodeDB

Autres logiciels aux fonctionnalités équivalentes
  • SRS

Logiciels ayant certaines des fonctions de Galaxy:

Environnement de développement
Eléments de pérennité
  • Il existe une très grande communauté d'utilisateurs
  • UCSC, génome browser très utilisé fait référence à Galaxy
  • La dynamique des développeurs
  • C'est le seul logiciel à ma connaissance, permettant à des personnes non informaticiens d'ouvrir des fichiers de plusieurs millions de lignes et pouvoir les rendre autonomes pour faire des calculs, filtres
Références d'utilisateurs institutionnels
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
  • La FAQ
  • Pour signaler un bug, faire des suggestions : galaxy-bugs [at] bx [dot] psu [dot] edu
  • Pour toutes questions sur l'utilisation de Galaxy : galaxy-user [at] bx [dot] psu [dot] edu
  • Pour toutes questions sur l'installation, la configuration ou l'intégration d'outils : galaxy-dev [at] bx [dot] psu [dot] edu
Documentation utilisateur

Le wiki

Pour citer Galaxy

Des tutoriels pour le développement sont disponibles ici et

Contributions

Des outils peuvent être développés et intégrés dans Galaxy. Les questions sont à poster sur galaxy-dev [at] bx [dot] psu [dot] edu
Pour la partie développement ici et ici

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 12/03/10
  • Correction mineure : 12/03/10
Mots-clés

Narcisse : navigateur de génomes comparés

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.

 

Fonctionnalités générales du logiciel

Narcisse est un outil de comparaison de génomes entièrement séquencés doté d’un navigateur permettant d’explorer à différentes échelles, des nucléotides aux chromosomes, les résultats de comparaison.

Il repose sur le principe de comparaison exhaustive de génomes deux-à-deux, à la fois au niveau nucléique et au niveau protéique. Cet outil a essentiellement deux composantes :

  1. Un pipeline de comparaison de génomes: à partir de génomes entièrement séquencés et de leurs annotations, il procède à l’identification de similitudes locales (alignements locaux à l’aide d’un outil spécifique développé par l’équipe) puis à la reconstruction de segments conservés à différents niveaux de résolution.
  2. Un navigateur de génomes comparés qui permet d’exploiter les différents niveaux de conservation identifiés par le processus décrit ci-dessus. Ce navigateur permet en particulier d’étudier aussi bien les conservations locales dans le voisinage des gènes que des conservations de segments chromosomiques. De nombreuses représentations sont proposées : dotplot, représentation de cartes comparées, représentation circos. La possibilité d’ajouter des données personnelles et de réaliser des comparaisons avec ses propres séquences permet d’adapter le navigateur à des besoins propres.

Nous maintenons une installation donnant accès aux comparaisons de génomes animaux, végétaux, de champignons et aussi de bactéries, à partir des données publiques. Il est par ailleurs possible d'accéder à ces données par l'intermédiaire de services Web Biomoby.

Narcisse peut être téléchargé et installé localement afin de répondre à des besoins spécifiques. Une API, qui repose sur l’API d’Ensembl, permet d’accéder facilement aux données génomiques, tandis qu'une API développée spécialement permet quant à elle d'accéder aux données de comparaison.

Contexte d’utilisation du logiciel

Démarche d’exploration de génomes entièrement séquencés et annotés par une approche de génomique comparative.

Publications liées au logiciel

Courcelle E, Beausse Y, Letort S, Stahl O, Fremez R, Ngom-Bru C, Gouzy J, Faraut T (2008). Narcisse: a mirror view of conserved syntenies. Nucleic Acids Res 36(Database issue):D485-90.

Fiche logiciel validé
  • Création ou MAJ importante : 10/07/13
  • Correction mineure : 10/07/13
  • Rédacteur de la fiche : Julie Josse - un des concepteurs du logiciel - Laboratoire de mathématique appliquée (AGROCAMPUS OUEST)
  • Relecteur(s) : Vincent Miele (LBBE)
    Delphine Charif (LBBE)
  • Contributions importantes : François Husson
  • Responsable thématique : Christelle Dantec (CRBM)
Mots-clés
Pour aller plus loin

FactoMineR : package du logiciel R dédié à l'analyse de données

Une fiche Dév Ens Sup est en relation avec cette fiche, consultez-la pour plus d'informations : FactoMineR
Description
Fonctionnalités générales

FactoMineR est un package du logiciel libre R dédié à l'analyse de données.

Il permet de réaliser les méthodes classiques (ACP, AFC, ACM, classification) et avancées (AFM, AFM Hiérarchique, AFM Duale).

De nombreux indicateurs et sorties graphiques sont disponibles.

Toutes les analyses peuvent être effectuées à l'aide d'un menu déroulant convivial.

La gestion des données manquantes en ACP, ACM et AFM est possible grâce à l'utilisation conjointe du logiciel libre R missMDA.

Interopérabilité
  • Il peut prendre en entrée des extensions csv, txt, xls.
  • Échanges possible avec Excel, SPSS, SAS, langage SQL.
Contexte d'utilisation dans mon laboratoire/service
  • FactoMineR est utilisé aussi bien en recherche qu'en enseignement et développement.

  • Il est utilisé par de nombreux organismes de recherche, des étudiants de différentes filières en France comme à l'étranger (dans plus de 70 pays).

  • FactoMineR s'adresse à un public aussi bien de statisticiens que de chercheurs ou étudiants d'autres disciplines scientifiques.

Environnement du logiciel
Plates-formes

Toutes les plates-formes

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes

Il existe un certain nombre de packages R dédiés aux analyses statistiques multivariées. Ces packages ont chacun leurs domaines d'application. Une brève revue est disponible à cette adresse: http://cran.r-project.org/web/views/Multivariate.html

Parmi ces packages, on peut citer deux packages de référence en écologie qui implémentent aussi les fonctions de bases en analyses multivariées (ACP, AFC, AD, ACM, ...) :

  • ade4 (http://pbil.univ-lyon1.fr/ADE-4/) qui propose des méthodes exploratoires et euclidiennes pour l'analyse des données en écologie (même point de vue géométrique que FactoMineR). Il dispose également d'une interface graphique ade4TkGUI. Une des spécificités d'ade4 est qu'il propose des méthodes pour les analyses k-tableaux ou encore des méthodes pour le couplage de tableaux (pcaiv, coinertie) toutes documentées dans des fiches techniques et thématiques.

  • vegan (http://cran.r-project.org/web/packages/vegan/index...), qui propose des méthodes d'analyses pour l'ecologie des communautés.

Dans ce contexte, la spécificité de FactoMineR est de proposer des méthodes d'analyses factorielles "avancées" non implémentées dans les autres packages. Par exemple : HCPC (combinant des méthodes de clustering), AFMH (analyse factorielle multiple hiérarchique) ou GPA (analyse procustéenne généralisée). Ce package propose aussi des sorties graphiques en 3D.

Environnement de développement
Type de structure associée au développement
Références d'utilisateurs institutionnels

Université de Rennes 2, Agrocampus, INRA, CNRS, IFREMER, CIRAD, L'OREAL, DANONE, SOREDAB, Unioversity of PRINCETON, Université de Barcelone, Universidad Nacional de la Patagonia, Agence de Conseil et de Recherche Océanographiques.....

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

Groupe Google : factominer-users [at] googlegroups [dot] com

Documentation utilisateur
Contributions

Envoyer un mail à husson [at] agrocampus-ouest [dot] fr

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 22/02/10
  • Correction mineure : 22/02/10
Mots-clés

NemoFish : analyse d'image pour les gènes et territoires chromosomiques en FISH 3D

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows
  • Version actuelle : 1.5 - 07/12/2009
  • Licence(s) : Autre - Creatice Commons V2 pour faire du freeware mais pas de l'open source (pas encore)
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Eddie Iannuccelli, Thomas Boudier
  • Contact concepteur(s) : eddie.iannuccelli@toulouse.inra.fr
  • Laboratoire(s), service(s)... : Génétique Cellulaire, Univ Paris 6 (UPMC)

 

Fonctionnalités générales du logiciel

Nemo (un autre logiciel NEMO est décrit dans PLUME, nous obligeant d'identifier par NemoFish notre logiciel pour Plume) est un logiciel d'analyse d'images permettant de détecter chromosomes, gènes, ARN et autres séquences marquées dans des noyaux cellulaires acquis en microscopie confocale (3D). Nemo propose une détection automatique, semi-automatique ou manuelle des objets, il fournit un certain nombre de caractéristiques pour chaque objet détecté (coordonnées de l'isobarycentre, volume, surface, compacité,distance de feret) ainsi que plusieurs distances pour chaque paire d'objets (distance centre à centre, bord à bord, bord à centre, angles via le centre du noyau, % de colocalisation). L'ensemble des mesures peut être stocké dans une base de données MySQL interrogeable via une interface dédiée.

Contexte d’utilisation du logiciel

Etude de la dynamique nucléaire dans différents états cellulaires

Publications liées au logiciel

NEMO: a tool for analyzing gene and chromosome territory distributions from 3D-FISH experiments
E. Iannuccelli; F. Mompart; J. Gellin; Y. Lahbib-Mansais; M. Yerle; T. Boudier
Bioinformatics 2010; doi: 10.1093/bioinformatics/btq013

Syndiquer le contenu