ergatis
Ergatis est un outil web qui permet de créer, d'exécuter, de superviser des pipelines d'analyses.
Il contient des composants bioinformatiques pré-intégrés mais peut très bien intégrer n'importe quel type de composants s'exécutant en ligne de commande.
Cette interface est basée sur l'outil workflow du TIGR (The Institute for Genomic Research) et peut donc être utilisée aussi bien sur une seule machine que sur un cluster de calcul (ordonnancé avec SGE, CONDOR, PBS ...).
- Ergatis gère les itérations sur une liste de fichiers
- Il permet d'enregistrer des pipelines pré-configurés pour les relancer ou de ré-exécuter des pipelines déjà joués
- L'accès aux fichiers d'entrée se fait directement par le chemin absolu sur le serveur (pas besoin d'uploader les données contrairement à Galaxy)
- L'authentification LDAP est très bien gérée.
Les composants fournis sont basés sur les formats BSML.
L'implémentation actuelle comprend un support pour le chargement des données dans le projet de bases de données suivant le schéma CHADO.
Sur la plateforme Bioinformatique Genotoul, plusieurs pipelines de traitement de données NGS ont été mis en place pour injecter les données dans notre système NG6. Nous avons aujourd'hui des pipelines pour traiter des données 454 et Illumina, le démultiplexage est intégré et permet ensuite de lancer chaque composant en parallèle sur les différents lots dé-multiplexés.
Au sein de l'équipe de Génomique des Systèmes Intégrés du laboratoire LMGM, ergatis a été utilisé pour la composition et l'exécution d'un pipeline d'analyses bioinformatiques. Le pipeline est décomposé en tâches, certaines pouvant être exécutées en parallèle, correspondant à des programmes en ligne de commande développés par l'équipe. Une fois le système pris en main, la création de nouveaux nœuds de traitement correspondant à des programmes en ligne de commande est aisée. L'interface d'ergatis permet la composition de workflows à partir des nœuds de traitement disponibles, avec des traitements en série ou en parallèle. Cette interface est plutôt destinée à des utilisateurs connaissant les logiciels sous-jacents aux traitements effectués (notamment les entrées/sorties de chaque tâche).
- La limitation principale est la gestion des structures conditionnelles qui n'est pas faite
- Les données sont stockées dans un répertoire commun
- De plus Ergatis est largement moins ergonomique que Galaxy, un biologiste devra être formé pour pouvoir utiliser cette interface
- Enfin ergatis est assez lourd et compliqué à installer (très nombreuses dépendances).