EuGène

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 05/03/12
  • Correction mineure : 05/03/12
Mots-clés

EuGène : prédicteur de gènes pour les organismes eucaryotes et procaryotes

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : v4.0a - 26 juillet 2011
  • Licence(s) : Autre - Artistic licence, compatible GPL
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Thomas Schiex
  • Contact concepteur(s) : eugene-help@lists.mulcyber.toulouse.inra.fr
  • Laboratoire(s), service(s)... : LIPM, UBIA

 

Fonctionnalités générales du logiciel

EuGène est un prédicteur des gènes pour des organismes eucaryotes et procaryotes, générique et extensible.

Ainsi, il est capable d'intégrer de nombreuses sources d'information de différentes natures :

  • il utilise des modèles probabilistes (comme les modèles de Markov) pour discriminer les régions codantes des non codantes ;
  • il intègre les résultats de prédicteurs de signaux (site d'épissage, début de traduction) ;
  • il peut également prendre en compte des similarités de séquences (EST, ARNm, protéines) et les résultats de prédicteurs de gènes existants;
  • il produit la prédiction la plus cohérente avec toutes les informations intégrées.
    Toutes les informations ci-dessus peuvent être lues au format natif EuGène ou au format standard GFF3.

EuGène est capable de prédire :

  • des variants d'épissage alternatif,
  • des ARN ne codant pas pour des protéines (ARNnc) depuis la version 3.6,
  • des gènes chevauchants, des ARNnc antisens et des opérons en mode procaryote, depuis la version 4.0.

Le logiciel est écrit en C++. Les résultats sont disponibles sous plusieurs formats (GFF3, HTML, etc)

Contexte d’utilisation du logiciel

EuGène a été utilisé pour l'annotation structurale de nombreux génomes :
Medicago truncatula,
Arabidopsis thaliana,
Arabidopsis lyrata,
Meloidogyne incognita,
Botrytis cinerea,
Laccaria bicolor,
Physcomitrella patens,
Populus trichocarpa,
Ostreococcus tauri,
Ostreococcus lucimarinus,
Micromonas pusilla (RCC299, CCMP1545, RCC809),
Bathycoccus,
Ectocarpus siliculosis,
Pichia postoris,
Tetranychus urticae,
Solanum lycopersicum,
Solanum tuberosum,

et plus récemment de la bactérie
Sinorhizobium meliloti.

Publications liées au logiciel

Genome Annotation in Plants and Fungi: EuGene as a model platform. S. Foissac, J. Gouzy, S. Rombauts, C. Mathé, J. Amselem, L. Sterck, Y. Van de Peer, P. Rouzé and T. Schiex. Current Bioinformatics 2008, 3, 87-97.

Integrating alternative splicing detection into gene prediction.S. Foissac, T. Schiex. BMC Bioinformatics 2005, 6:25

EuGene'Hom: a generic similarity-based gene finder using multiple homologuous sequences. S. Foissac, P. Bardou, A. Moisan, MJ. Cros, T. Schiex. Nucleic Acid Res. 2003, vol. 31, n. 13

EuGene: An Eucaryotic Gene Finder that combines several sources of evidence. T. Schiex, A. Moisan and P. Rouzé. Computational Biology, Eds. O. Gascuel and M-F. Sagot, LNCS 2066, pp. 111-125, 2001.