IMPUTE

Fiche logiciel à valider
  • Création ou MAJ importante : 06/05/09
  • Correction mineure : 21/08/09
Mots-clés
Pour aller plus loin

IMPUTE : estimation des génotypes de SNPs non directement génotypés par des instruments

Ce logiciel est en cours d'évaluation par la communauté PLUME. Si vous utilisez ce logiciel en production dans notre communauté, merci de déposer un commentaire.
Description
Fonctionnalités générales

IMPUTE est un logiciel utilisé dans le cadre d’étude en épidémiologie génétique pour estimer les génotypes de SNPs non génotypés à partir d’autres SNPs génotypés et d’un ensemble d’haplotypes connus issus par exemple du projet HapMap. Les génotypes imputés par ce logiciel pourront ensuite être analysés par le logiciel SNPTEST (cf http://www.projet-plume.org/fiche/snptest ) ou QUICKTEST.

Il est utilisé pour des analyses « génome-entier ». Les haplotypes issus de la phase II du projet HapMap, formatés pour être directement utilisés par IMPUTE sont disponibles sur le site.

Autres fonctionnalités
  • Possibilité d'imputer des SNPs génotypés
  • Possibilité de délimiter la région, en paires de bases, à imputer
  • Fichier de sortie mesurant la qualité d'imputation
Interopérabilité

IMPUTE peut lire des génotypes au format CHIAMO ou PLINK. Les données en sortie sont utilisables par les programmes SNPTEST et QUICKTEST.

Contexte d'utilisation dans mon laboratoire/service

Nous l’avons utilisé dans le cadre d’étude génome-entier. A partir des 320000 SNPs génotypés par des puces Illumina, nous avons généré des génotypes pour l’ensemble des 2,5 millions de SNPs du projet HapMap.
Nous l'utilisons sur une plateforme Linux Mandriva 2007 64 bits sur une machine quadri-processeurs dua-core, 32G de mémoire.

Limitations, difficultés, fonctionnalités importantes non couvertes
  • Ce programme doit être exécuté sur des portions de chromosome, typiquement entre 5 et 10 Mbp, afin de ne pas saturer la mémoire. Les fichiers de résultats peuvent ensuite être concaténés pour le chromosome complet.
  • Les positions physiques des 2 jeux de données (génotypes observés et haplotypes HapMap) doivent correspondre. Si un SNP a des positions différentes dans les données génotypes et dans les données HapMap, il sera présent 2 fois en sortie : 1 fois en tant que SNP typé et une fois en tant que SNP imputé, avec des résultats différents.
  • Afin d’inférer des SNPs à partir de génotypes de bonne qualité, nous utilisons PLINK pour réaliser un contrôle de qualité. Nous filtrons les génotypes observés qui seront utilisés pour l’imputation sur 3 critères : % de génotype manquant par individu, % de génotypes manquant par SNP et équilibre de Hardy-Weinberg.
  • Si un fichier d’entrée est manquant, le programme bloque en attente de lecture sur l’entrée standard, sans donner aucun message d’erreur.
  • Seules les binaires sont accessibles au téléchargement.
Environnement du logiciel
Plates-formes
  • Linux (x86_64, i386)
  • Mac OS X 10.4.11 (Intel)
  • Mac OS X 10.5.1 (Intel)
  • Mac OS X (PowerPC)
  • Solaris 5.8 (Sun SPARC)
  • Solaris 5.10 (AMD Opterons)
  • SLES 10 (Intel Itanium2)
  • Windows MS-DOS (Intel)
Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

Université d’Oxford, Department of Statistics
Auteurs : Jonathan Marchini, Bryan Howie

Environnement utilisateur
Documentation utilisateur