PLINK

Fiche logiciel à valider
  • Création ou MAJ importante : 06/05/09
  • Correction mineure : 18/08/09
Mots-clés
Pour aller plus loin

PLINK : analyse de type "génome-entier"

Ce logiciel est en cours d'évaluation par la communauté PLUME. Si vous utilisez ce logiciel en production dans notre communauté, merci de déposer un commentaire.
Description
Fonctionnalités générales

PLINK est un logiciel utilisé dans le cadre d’études en épidémiologie génétique pour réaliser des analyses “génome-entier”. Il permet de réaliser un grand nombre de types d’analyse : analyse de SNP, de CNV, d’haplotypes, analyse de traits binaires (cas-contrôle) et quantitatifs, analyse de stratification de population, estimation d’IBD/IBS, analyses familiales de type TDT, analyse d’épistasie. Il a également des fonctions d’imputation. Enfin, il facilite la manipulation de données du type extraction d'individus ou de SNP, combinaison de plusieurs jeux de données, modification de codage. Il sait lire plusieurs formats ascii, et utilise son propre format binaire de compression.

Ce logiciel est utile pour analyser des données “haut-débit”, ie des génotypes produits par des plates-formes Illumina ou Affymetrix. Pour donner un exemple, nous l’avons utilisé pour analyser 2 études (portant respectivement sur 1379 et 2796 individus) et comportant 320000 SNPs.

PLINK s'utilise en ligne de commande, il est écrit en C++.

Autres fonctionnalités
  • gestion des données : recodage des allèles en lettres ou nombres, selon le sens de génotypage (DNA strand), selon des modèles additif ou dominant, modification des cartes physiques des SNP, extraction ou inclusion de données (SNP et/ou individus), combinaison de plusieurs jeux de données
  • contrôle de qualité : génotypes manquants, déséquilibre de liaison (Hardy-Weinberg Equilibrium ou HWE), fréquences alléliques, incompatibilités Mendéliennes, vérification du sexe sur la base du chromosome X
  • seuils d'inclusion pour les individus et les SNP en fonction du taux de génotypes manquant, pour les SNP en fonction des fréquences alléliques, du déséquilibre de liaison et de la significativité du test de déséquilibre de liaison
  • stratification de population : classification en fonction de l'IBS
  • estimation des IBS/IBD dans les données familiales
  • analyses d'association pour des traits binaires et quantitatifs, pour l'interaction gène * trait, avec ajustement pour les tests multiples (Bonferroni, Sidak, FDR)
  • analyses de données familiales : TDT (Transmission Disequilibrium Test), DFAM, QFAM
  • possibilité d'utiliser des procédures de permutation pour déterminer des p-values empiriques
  • analyses d'haplotypes : estimation des fréquences des haplotypes, test d'haplotype avec des traits binaires ou quantitatifs
  • imputation de génotypes : implémentation récente, en beta-test
  • test d'epistasie pour des cas-contrôles ou des cas uniquement
  • analyse de CNV (Copy Number Variant) et de CNP (Copy Number Polymorphysms)
  • analyse d'un sous-groupe de SNPs
  • annotation de SNP sur la base d'un accès distant (localisation, MAF, allèles, conservation, gène etc...)
Contexte d'utilisation dans mon laboratoire/service

A l’UMR 8090, nous l’avons utilisé pour analyser 2 études, portant respectivement sur 1379 et 2796 individus et comportant 320000 SNPs (Nature Genetics 41, 157 - 159 (2009)).
Nous l’avons utilisé pour analyser des traits qualitatifs et des traits quantitatifs, selon 3 modèles génétiques (additif, dominant et récessif), avec et sans correction par des co-variables.

4 personnes l’utilisent plusieurs fois par mois, 2 bio-informaticiens et 2 bio-statisticiens.

Nous l’utilisons sur une plateforme Linux Mandriva 2007 64 bits sur une machine quadri-processeurs dual-core, 32 G de mémoire

Environnement du logiciel
Plates-formes
  • Linux (x86_64, i686)
  • MS-DOS
  • Apple Mac (PPC)
  • Apple Mac (Intel)

Les binaires et les sources (C/C++) sont accessibles au téléchargement.

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

PLINK est développé par Shaun Purcell "Center for Human Genetic Research (CHGR)", "Massachusetts General Hospital (MGH)" and the "Broad Institute of Harvard & MIT".
Contributeurs :

  • Paul de Bakker: testing and many detailed suggestions
  • David Bender: Haploview interface for veiwing PLINK results
  • Mark Daly: various statistical and computational algorithms
  • Julian Maller: Haploview interface for veiwing PLINK results
  • Ben Neale: IBD estimation routines
  • Robert Plenge: early beta-testing
  • Douglas Ruderfer: coding of various internal PLINK functions
  • Lori Thomas: development of PLINK-O-MATIC and beta version of gPLINK
  • Kathe Todd-Brown: gPLINK development
  • Pak Sham: IBD estimation and other association routines
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

liste de diffusion : plink-list [at] chgr [dot] mgh [dot] harvard [dot] edu

Documentation utilisateur

Documentation en ligne : http://pngu.mgh.harvard.edu/~purcell/plink/index.s... + version PDF,
Tutorial et FAQ en ligne