PyroCleaner : nettoyer des lectures issues de pyroséquencage

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 28/01/11
  • Correction mineure : 28/01/11
  • Auteur de la fiche : Mariette Jérôme (Plateforme Bioinformatique Midi-Pyrénées)
  • Responsable thématique : Emmanuel Courcelle (LIPM)
Mots-clés
Fonctionnalités générales du logiciel

PyroCleaner est un script python permettant de nettoyer les lectures issues du séquenceur 454 afin de faciliter l'exécution d'un assembleur. Il filtre les séquences dupliquées et supprime les séquences selon des critères tels que la taille, la complexité et le nombre de bases indéterminées (N). Il permet aussi de nettoyer les séquences paired-end et génère 2 fichiers, un premier avec les paired-ends validés et un second pour les séquences shotgun.

PyroCleaner accepte les formats de fichiers sff, fasta et fastq et peut générer ces mêmes formats en fonction des paramètres utilisés.

Contexte d’utilisation du logiciel

Pyrocleaner est utilisé en routine afin de nettoyer les données génomiques obtenues par du séquençage 454. Il a par exemple été utilisé afin de nettoyer l'ensemble des données 454 lors de l'assemblage du génome de la tomate.