Format BED : Browser Extensible Data (Génome)

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 05/12/09
  • Correction mineure : 20/10/10
Mots-clés

Format BED : Browser Extensible Data (Génome)

Version : pas de version

Extension (importante sous Windows) : .bed

Type de document : Fichier texte tabulé : Browser Extensible Data

Document de standardisation : Page descriptive sur le site de UCSC

Description courte :

Format pour décrire les coordonnées d'éléments du génome (gènes, transcrits, séquences ...).

Avantages :

  • A été développé par UCSC (University of California Santa Cruz) mais est un standard pour beaucoup d'autres logiciels.
  • Ce format est modulable et peut contenir plus ou moins d'informations (minimum : chromosome, position 'start' et 'end').
  • Permet de représenter graphiquement de manière très simple des profils de plusieurs millions de séquences.
  • Permet d'associer des scores et lors de l'affichage de moduler la couleur.

Inconvénients:

Lorsqu'on récupère un fichier bed, on ne sait pas automatiquement quelles informations seront présentes.

Logiciels de traitement les plus connus :

  • UCSC
  • Ensembl
  • GBrowse Fiche Plume
  • Les logiciels d'alignement et d'analyse de séquençage fournissent souvent des résultats au format .bed

Format connexe :

  • GFF (General Feature Format)

Commentaire :

UCSC, qui a développé ce format, numérote la première position sur un génome à 0 et non à 1. Les fichiers bed peuvent donc avoir un décalage de 1 dans les positions 'start' et 'end' selon le logiciel qui l'aura généré. Toujours vérifier le système de numérotation.