Format BED : Browser Extensible Data (Génome)
Version : pas de version
Extension (importante sous Windows) : .bed
Type de document : Fichier texte tabulé : Browser Extensible Data
Document de standardisation : Page descriptive sur le site de UCSC
Description courte :
Format pour décrire les coordonnées d'éléments du génome (gènes, transcrits, séquences ...).
Avantages :
- A été développé par UCSC (University of California Santa Cruz) mais est un standard pour beaucoup d'autres logiciels.
- Ce format est modulable et peut contenir plus ou moins d'informations (minimum : chromosome, position 'start' et 'end').
- Permet de représenter graphiquement de manière très simple des profils de plusieurs millions de séquences.
- Permet d'associer des scores et lors de l'affichage de moduler la couleur.
Inconvénients:
Lorsqu'on récupère un fichier bed, on ne sait pas automatiquement quelles informations seront présentes.
Logiciels de traitement les plus connus :
- UCSC
- Ensembl
- GBrowse
- Les logiciels d'alignement et d'analyse de séquençage fournissent souvent des résultats au format .bed
Format connexe :
- GFF (General Feature Format)
Commentaire :
UCSC, qui a développé ce format, numérote la première position sur un génome à 0 et non à 1. Les fichiers bed peuvent donc avoir un décalage de 1 dans les positions 'start' et 'end' selon le logiciel qui l'aura généré. Toujours vérifier le système de numérotation.