Ensembl API

Fiche logiciel validé
  • Création ou MAJ importante : 17/12/12
  • Correction mineure : 13/11/13
Mots-clés

Ensembl API : interface de programmation pour l'accès aux bases de donnees Ensembl

Description
Fonctionnalités générales

Bibliothèques Perl permettant d'accéder facilement :

- aux données d'annotations avec le module Core : séquences, gènes, transcrits aletrnatifs, exons, introns, Gene Ontology, Symbol, Ensembl ID, FBgn, ...

- aux données comparatives inter-espèces avec le module Compara : alignements entre génomes, synténie, prédictions paralogues et orthologues, familles de protéines , ...

- aux données d'évolution avec le module Variation : SNP, mutations somatiques, variants de structures, ...

- aux données de régulations transcriptionnelles avec le module Funcgen : ouverture de la chromatine, facteurs de transcription, modifications de l'histone.

Autres fonctionnalités

Ces composants permettent un lien entre un programme et les bases de données Ensembl. Il est ainsi possible de requêter directement la base de données de l'EBI ou n'importe quel miroir tout comme une instance locale.

Les fichiers de configuration des API permettent de spécifier pour chaque espèce quel serveur de base de données utiliser. Pour un usage local il n'est donc pas nécessaire d'installer la totalité des bases de données Ensembl, mais uniquement celles d'intérêt.

Les API proposent des objets de haut niveau dotés d'une gestion efficace et rapide aux données et permettent de s'abstraire du schéma relationnel sous-jacent.

L'API fournit également des méthodes de modifications des données ... dans le cadre d'une instance locale, il va de soi.

Interopérabilité

Ces bibliothèques Perl ont comme sources de données d'annotation celles proposées par l'EBI.

Contexte d'utilisation dans mon laboratoire/service

Les API EnsEMBL sont utilisées pour annoter les données produites, et permettre les comparaisons entre espèces.

Limitations, difficultés, fonctionnalités importantes non couvertes

Une maîtrise du langage Perl est nécessaire.

Pour un usage intensif, l'accès direct aux bases de données d'EnsEMBL est déconseillé : lenteur du réseau, risque d'être black-listé dans le cas d'un usage vraiment trop important.

Il est primordial de garder une adéquation entre la version des API et celles des bases de données, au risque de générer des résultats partiels ou incohérents.

Environnement du logiciel
Plates-formes

Linux, Mac OS, Windows (Active Perl)

Logiciels connexes

BioMart DAS

Autres logiciels aux fonctionnalités équivalentes

Le plus connu des "Genome Browsers" outre-Atlantique est celui de l'UCSC. Ce dernier offre également des API pour consulter de façon automatique ses données.

Environnement de développement
Type de structure associée au développement
Eléments de pérennité

Existe depuis 1999, le projet comporte 7 équipes représentant entre 40 et 50 personnes.
Le projet met à disposition plusieurs versions par an.

Références d'utilisateurs institutionnels
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur
Divers (astuces, actualités, sécurité)