REPET

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 29/04/10
  • Correction mineure : 14/02/11
Mots-clés

REPET : annotation des éléments transposables (génomique)

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : 1.3.12.1 - 31/12/2010
  • Licence(s) : CeCILL
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Francoise Alfama Sandie Arnoux Delphine Autard Benoit Bely Marc Bras Elodie Duprat Gael Faroux Timothee Flutre Claire Hoede Olivier Inizan Hadi Quesneville Dorothee Valdenaire
  • Contact concepteur(s) : urgi-repet@versailles.inra.fr
  • Laboratoire(s), service(s)... : URGI

 

Fonctionnalités générales du logiciel

De plus en plus de génomes sont actuellement séquencés dans leur intégralité. Les éléments transposables (ETs) ayant un impact important sur la biologie des génomes, il est indispensable de les identifier. Dans ce but, le package REPET déploie deux pipelines, TEdenovo et TEannot, dédiés à la détection, l'annotation et l'analyse de ces répétitions. Afin d'améliorer la sensibilité de la procédure, ces pipelines combinent plusieurs outils tout en réconciliant leur résultats.

  • Identification des familles d'ETs par une approche de novo: le pipeline TEdenovo commence par aligner le génome contre lui même. Dans un deuxième temps il clusterise les matches puis il construit pour chaque cluster un alignement multiple à partir duquel est obtenue une séquence consensus. Finalement les consensus sont classifiés sur la base de leur caractéristiques d'ETs et la redondance est enlevée.
  • Annotation des copies d'ETs: le pipeline TEannot permet, à partir d'une banque de référence d'ETs, (les consensus issus du TEdenovo par exemple) d'identifier les copies de ces éléments dans le génome. Un filtre statistique empirique permet d'enlever les faux-positifs et les mini-satellites sont également annotés. Une fois les fragments d'ETs identifiés, ceux appartenant à une même copie sont connectés via programmation dynamique ainsi que par une procédure prenant en compte l'âge des éléments.
  • REPET est développé en Python et C++. Afin de gérer de grand volume de données, il interagit fréquemment avec une base de données MySQL et le gestionnaire de cluster SGE.
Contexte d’utilisation du logiciel

Ce package est utilisé dans un contexte de recherches menées sur la dynamique des génomes.

Publications liées au logiciel

Flutre T, Duprat E, Feuillet C, Quesneville H (2011)
Considering transposable element diversification in de novo annotation approaches.
PLoS ONE 6(1): e16526. doi:10.1371/journal.pone.0016526

Combined Evidence Annotation of Transposable Elements in Genome Sequences, Quesneville et al. Plos Computational Biology.
http://www.ploscompbiol.org/article/info:doi/10.13...