biologie

Logiciels (logiciels libres en majorité) ou ressources (liées aux logiciels) utiles aux chercheurs et enseignants en biologie
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 17/02/10
  • Correction mineure : 23/03/10
  • Auteur de la fiche : Florian Salipante (IGF - Contrôle de l'apoptose et de la prolifération dans les systèmes neuronaux et endocriniens)
  • Responsable thématique : Christelle Dantec (CRBM)
Mots-clés

GAGG : algorithme (codé en R) qui permet le clustering de gènes

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 1.1 - 12/01/2010
  • Licence(s) : choix en cours, contacter l'auteur
  • Etat : utilisé en interne
  • Support : maintenu, développement en cours
  • Concepteur(s) : Florian Salipante, Christelle Reynès, Robert Sabatier
  • Contact concepteur(s) : florian.salipante@univ-montp1.fr
  • Laboratoire(s), service(s)... : IGF, équipe d'accueil 'Laboratoire de Physique Industrielle et Traitement de l'Information'

 

Fonctionnalités générales du logiciel

GAGG (Genetic Algorithm for Gene Gathering) est une nouvelle méthode statistique qui détecte les gènes différentiellement exprimés et les regroupe en classes en fonction de leurs profils d’expression. C’est une méthode factorielle basée sur un codage en entiers des variables de projection. Elle permet de prendre en considération l’aspect multivarié des données et parvient à détecter les gènes les plus intéressants. Elle repose sur l’utilisation d’un algorithme génétique et combine plusieurs critères statistiques liés à l’ACP et aux k-means. Cette méthode a été implémentée sous R .
Le code est composé de cinq fonctions, une fonction principale GAGG, trois fonctions internes GAGG1, GAGG2 et GAGG3, et une fonction permettant de visualiser les profils de gènes PlotProfiles.

 

Profils
Contexte d’utilisation du logiciel

L'algorithme GAGG est utilisé pour réaliser des groupes de gènes ayant des profils d'expression similaires.

Il peut être utilisé par toute personne (biologiste, statisticien, bioinformaticien essentiellement) ayant un prérequis minimal dans l'utilisation du logiciel R. Des connaissances en statistique et notamment en analyse en composantes principales sont un plus pour la compréhension des sorties graphiques, mais ne sont pas indispensables dans la mesure où les groupes sont générés de manière autonome par l'algorithme. De la même façon, des paramètres par défaut sont donnés pour l'algorithme génétique, le paramètre Tpop relatif à la taille de la population et le paramètre Ngene relatif au nombre de générations pourra être augmenté par l'utilisateur, ce qui augmentera les chances de converger vers la solution optimale mais rallongera le temps de calcul.

L'algorithme permet de traiter indifféremment des puces à ADN monocolore ou bicolore, le pre-traitement des données étant laissé à l'utilisateur qui peut choisir les techniques de son choix pour la normalisation (Quantile normalization, loess, lowess etc..), la standardisation et toute autre forme de pré-traitement des données, notamment PM seul ou PM-MM, log2(cy3/cy5) ou log10(cy3/cy5) ou uniquement cy3/cy5 etc...

Les données doivent donc être sous la forme d'une matrice avec en lignes les gènes et en colonnes les différentes conditions expérimentales. Si nécessaire, l'algorithme pourra ultérieurement être complété par une étape de pré-traitement.

La méthode GAGG donne de bon résultats pour la classification de gènes, pour cela elle utilise un algorithme génétique qui est gourmand en calcul, ce qui entraîne un temps d'éxécution généralement long (plusieurs heures), fonction de la taille des données et des paramètres Tpop et Ngene. Au début de l'algorithme, un message demande combien l'utilisateur veut calculer de composantes aux vues des pourcentages affichés plus haut, pour les non initiés à l'analyse en composantes principales, on prendra la plupart du temps deux composantes excepté si la troisième composante apporte encore beaucoup d'information, à savoir que plus le nombre de composantes sera élevé plus le nombre de groupes risque d'être élevé.  

Le code source peut être téléchargé.

Publications liées au logiciel

Un article est en cours de publication sur la méthode GAGG dans la revue CSDA.

Fichier attachéTaille
profils.png120.73 Ko

Format BAR : Binary ARchive (Génome)

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 15/02/10
  • Correction mineure : 30/03/10
  • Fiches logiciel PLUME connexes : MACS
Mots-clés

Format BAR : Binary ARchive (Génome)

Acronyme : BAR

Nom complet : Binary ARchive

Description courte : Fichier binaire.
Format pour décrire des informations d'analyse (signal, p-value pour des positions génomiques) de tiling array. Ce format a été créé par Affymetrix mais d'autres logiciels se le sont appropriés.

Extension par convention : .bar

Document de standardisation : http://www.affymetrix.com/support/developer/powert...

Avantages : Est peu volumineux comparé à un fichier texte.

Inconvénients :

  • La lecture du fichier n'est pas aussi aisée pour que un fichier texte.
  • Dépend de la norme utilisée pour lire le fichier bar.

Utilisations recommandées :
Souvent utilisé pour des données de ChIP on Chip (Chromatin ImmunoPrecipitation on Chip) ou de chIP-seq (ChIP-Sequencing)

Logiciels de traitement les plus connus :

  • Tiling Analysis Software d'Affymetrix, format accepté en entrée et en sortie

  • IGB, format accepté en entrée
  • Cisgenome, format généré
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 12/02/10
  • Correction mineure : 12/02/10
Mots-clés

ESPript : visualisation d'alignements multiples corrélés à la structure secondaire

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : 2.0 - 2006
  • Licence(s) : Licence propriétaire -

    Une licence est accordée aux laboratoires académiques après demande faite par fax ou courrier aux auteurs.

    Une licence est accordée aux compagnies commerciales après demande faite par lettre recommandée auprès du CNRS et paiement d'un droit d'exploitation.

  • Support : maintenu, développement en cours
  • Concepteur(s) : Patrice Gouet, Emmanuel Courcelle, Xavier Robert
  • Contact concepteur(s) : p.gouet@ibcp.fr
  • Laboratoire(s), service(s)... : IBCP, IPBS

 

Fonctionnalités générales du logiciel

ESPript est un programme écrit en fortran, capable de lire en entrée :

  • Un fichier d'alignement multiple de séquences protéiques,
  • Un fichier de structures secondaires au format DSSP,

et de générer un fichier postcript représentant l'alignement multiple (avec un code de couleur suivant le degré d'homologie entre séquences), ainsi que des symboles indiquant les structures secondaires. Il est ainsi aisé de déterminer d'éventuelles corrélations entre ces deux types d'informations.

ESPript travaille en mode conversationnel, il est simple de l'intégrer dans un fichier de commandes (script). Le fichier généré est de bonne qualité, et peut être utilisé tel quel dans une publication.

  • Un site web a été mis en place, il permet bien sûr d'héberger la documentation, mais il offre également une interface permettant d'utiliser ESPript de manière simple et en même temps très complète. Le site web permet par ailleurs de générer les figures dans d'autres formats que le postcript: tiff, png, pdf. Le fichier d'entrée d'ESPript étant accessbile, le site peut être également vu comme un tutoriel d'utilisation du programme en ligne de commande.
  • Une autre interface web, appelée ENDSCRIPT, a également été écrite: Elle permet la création d'un alignement multiple à partir d'un fichier pdb téléchargé (ou à partir d'un identifiant pdb), et d'afficher cet alignement avec les informations structurales connues. Plusieurs programmes externes (blast, clustal, phylodendron, dssp) sont appelés de manière transparente par ce script. ESPript est utilisé pour afficher les informations d'alignement de séquence, et Molscript, bobscript, dino pour afficher les informations de structure tridimensionnelle.

Ces deux sites sont mis à la disposition de la communauté des chercheurs en biologie structurale.

ESPript lit un très grand nombre de formats en entrée: MULTALIN/CLUSTAL/GCG/SEAVIEW/MAXHOM/THREADER/PDB.

Contexte d’utilisation du logiciel

Analyse comparative des relations structures/fonctions sur la base des informations de séquence et de structure 3D de protéines homologues. Optimisation d'alignements multiples.

Publications liées au logiciel

Gouet, P., Robert, X. & Courcelle E. (2003).
ESPript/ENDscript: extracting and rendering sequence and 3D information from atomic structures of proteins. Nucl. Acids Res. 31: 3320-3323

Format GFF : General Feature Format (Génome)

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 07/02/10
  • Correction mineure : 25/03/10
Mots-clés

Format GFF : General Feature Format (Génome)

Acronyme : GFF

Nom complet : General Feature Format

Description courte :
Fichier texte tabulé de 9 colonnes.
Format pour décrire les coordonnées d'éléments du génome (gènes, transcrits, séquences ...).

Extension par convention: .gff

Version actuelle : 3

Document de standardisation : sur le site sequenceontology

Avantages :

  • A été développé par le Sanger Institut mais est un standard pour beaucoup d'autres logiciels.
  • Ce format contient des informations complètes ('chromosome', 'position', 'start','end','strand').

Inconvénients : Peut devenir vite volumineux.

Logiciels de traitement les plus connus :

Formats connexes : BED (Browser Extensible Data) Fiche Plume

Commentaires :
Pour valider son format GFF (existe une version online limitée à 3.000.000 de lignes, sinon télécharger le script pour l'utiliser en ligne de commande)

URL pour plus d'informations : http://biowiki.org/GffFormat

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 12/01/10
  • Correction mineure : 19/04/13
Mots-clés

BOMBEC : simulation du couplage fluide-structure en coordonnées eulériennes

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, MacOS X
  • Version actuelle : 0.25 - novembre 2009
  • Licence(s) : choix en cours, contacter l'auteur
  • Etat : utilisé en interne
  • Support : maintenu, développement en cours
  • Concepteur(s) : C. Bost, E. Maitre, T. Milcent
  • Contact concepteur(s) : Emmanuel.Maitre@imag.fr
  • Laboratoire(s), service(s)... : LJK, SPECTRO

 

Fonctionnalités générales du logiciel
  • simulation du comportement sous cisaillement de membranes élastiques immergées. L'élasticité prise en compte est de type changement d'aire et courbure moyenne. En dimensions 2 et 3.
  • simulation de l'interaction d'un corps élastique avec un fluide de même dimension dans lequel il est immergé. En dimension 3.
  • simulation du déplacement d'un solide rigide dans un fluide. En dimensions 2 et 3.
Contexte d’utilisation du logiciel
  • simulation des formes d'équilibre des globules rouges.
  • simulation du comportement d'un globule rouge dans un écoulement cisaillé.
  • simulation de la contraction d'un cardiomyocyte isolé dans une boîte de Pétri.
  • simulation de la chute d'une sphère dans un fluide.
Publications liées au logiciel

E. Maitre, T. Milcent, G.-H. Cottet, A. Raoult et Y. Usson, Applications of level set methods in computational biophysics, Math. Comput. Model., 49 (11-12), 2161–2169, 2009.

G.-H. Cottet, E. Maitre et T. Milcent, Eulerian formulation and level set models for incompressible fluid-structure interaction, ESAIM-Math. Model. Numer. Anal., 42 (3), 471–492, 2008.
G.-H. Cottet et E. Maitre, A level set method for fluid-structure interactions with immersed surfaces, Math. Models Meth. Appl. Sci., 16 (3), 415–438, 2006.

 

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 11/01/10
  • Correction mineure : 11/01/10
Mots-clés

FLEXIBLE : déformation et changement de conformation biomolécules par excitations externes (Modes Statiques)

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Système : UNIX-like
  • Licence(s) : choix en cours, contacter l'auteur
  • Etat : en développement
  • Support : maintenu, développement en cours
  • Concepteur(s) : Mehdi Djafari Rouhani, Georges Landa, Marie Brut
  • Contact concepteur(s) : djafari@laas.fr
  • Laboratoire(s), service(s)... : LAAS

 

Fonctionnalités générales du logiciel

Ce logiciel est dédié à la simulation, à l’échelle atomique, de la flexibilité des molécules biologiques. Les déformations des biomolécules sous l’action de diverses excitations extérieures, appelées Modes Statiques, sont déterminées par inversion de la matrice Hessienne. Cette matrice peut être calculée à partir de modèles énergétiques variés, utilisant un traitement quantique ou une approximation classique.

Contexte d’utilisation du logiciel

Ce logiciel a été utilisé dans un cadre universitaire pour :

  • Etudier la flexibilité de quelques biomolécules spécifiques.
  • Examiner leur réponse à des excitations extérieures, provoquées en particulier par des ions en solution.
  • Reproduire des changements de conformation.
Publications liées au logiciel

M. Brut, A. Esteve, G. Landa, M. Djafari Rouhani
An alternative approach for the treatment of biomolecular flexibility: the static Modes
ISMB 2008, 16th Int. Conf. on Intelligent Systems for Molecular Biology, 19-23 July 2008, Toronto, Canada

M. Brut, A. Esteve, G. Landa, G. Renvez, M. Djafari Rouhani
The Static Modes: An alternative approach for the treatment of macro and bio-molecular induced-fit flexibility
Eur. Phys. J. E 28 (2009) 17

M. Brut, G. Renvez, A. Estève, M. Djafari Rouhani, G.Landa, D. Estève
Blind Prediction of Biomolecular Flexibility Through Static Modes
Symp. M, Bioinspired and Biointegrated Materials as New Frontiers Nanomaterials
E-MRS Spring meeting, 8-12 Juin 2009, Strasbourg

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 11/01/10
  • Correction mineure : 31/03/10
Mots-clés

Rheolef : résolution des équations aux dérivées partielles par la méthode des éléments finis

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, MacOS X
  • Licence(s) : GPL
  • Etat : validé (au sens PLUME), diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Pierre Saramito
  • Contact concepteur(s) : Pierre.Saramito@imag.fr
  • Laboratoire(s), service(s)... : LJK

 

Une fiche logiciel décrit plus en détail ce développement, consultez la pour plus d’informations : Rheolef
Fonctionnalités générales du logiciel

Rheolef est un environnement logiciel pour résoudre les équations aux dérivées partielles par la méthode des éléments finis. Rheolef propose les algorithmes les plus pointus : solveurs préconditionnés pour l'élasticité incompressible, les fluides de Stokes et Navier-Stokes, méthode des caractéristiques de degré élevé pour les problèmes de convection dominante en thermique, etc.

Contexte d’utilisation du logiciel

Utilisé par de nombreux chercheurs et doctorants, tant dans des laboratoires de mathématiques appliquées que de physique ou de mécanique. La syntaxe très concise des codes permet de traduire directement les problèmes d'équations aux dérivées partielles en code exécutable : la correspondance entre les lignes écrites sur le papier et les lignes de code est directe. Ceci assure une grande lisibilité des codes : le temps de développement est ainsi grandement diminué. Enfin, ceci ne se fait pas au détriment de la rapidité d'exécution car le code, écrit en c++, est compilé avant l'utilisation. Par comparaison, des codes interprétés, tel octave ou matlab, seraient plus lents.
L'entête de la page web de Rheolef illustre bien cette correspondance entre le formalisme mathématique et les lignes de code écrites par l'utilisateur.

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 05/01/10
  • Correction mineure : 21/05/19
Mots-clés

Monolix : analyse de modèle non-linéaire à effets mixtes

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 3.1 - 10/2009
  • Licence(s) : CeCILL
  • Etat : validé (au sens PLUME), en développement
  • Support : maintenu, développement en cours
  • Concepteur(s) :
    • Marc Lavielle
    • Hector Mesa
    • Kaelig Chatel
  • Contact concepteur(s) : Marc.Lavielle@math.u-psud.fr
  • Laboratoire(s), service(s)... : INRIA Saclay, Labo Maths Orsay, NeuroSpin

 

Une fiche logiciel décrit plus en détail ce développement, consultez la pour plus d’informations : Monolix
Fonctionnalités générales du logiciel

Monolix est un logiciel permettant de modéliser des phénomènes biologiques, notamment dans le cadre d'études pharmacologiques.

Contexte d’utilisation du logiciel
  • Recherches en statistique : Universities Paris 5, 11 and 13
  • Recherches en pharmacologie : INSERM - P7
  • Recherches en micro-biologie : INRA
Publications liées au logiciel

Sur l'algorithme SAEM

  • Delyon B., Lavielle M., and Moulines E. "Convergence of a stochastic approximation version of the EM algorithm" The Annals of Stat., vol 27, no. 1, pp 94-128, 1999.
  • Kuhn E., Lavielle M. "Coupling a stochastic approximation version of EM with a MCMC procedure" ESAIM P&S, vol.8, pp 115-131, 2004.
  • Kuhn E., Lavielle M. "Maximum likelihood estimation in nonlinear mixed effects models" Computational Statistics and Data Analysis, vol. 49, No. 4, pp 1020-1038, 2005.
  • Lavielle M., Meza C. "A Parameter Expansion version of the SAEM algorithm" Statistics and Computing, vol. 17, pp 121-130, 2007.
  • Donnet S., Samson A. "Estimation of parameters in incomplete data models defined by dynamical systems" Jour. of Stat. Planning and Inference, vol. 137, no. 9, pp 2815-2831, 2007.
  • Meza C., Jaffrezic F., Foulley J.L. "REML estimation of variance parameters in non linear mixed effects models using the SAEM algorithm" The Biometrical Journal 49, 1-13, 2007.
  • Donnet S., Samson A. "Parametric inference for mixed models defined by stochastic differential equations" ESAIM P&S, 12:196-218, (2008).

Applications de SAEM

  • Makowski D., Lavielle M. "Using SAEM to estimate parameters of models of response to applied fertilizer" Journal of agricultural, Biological and Enviromental Statistics, vol. 11, n. 1, pp. 45-60, 2006.
  • Samson A., Lavielle M., Mentré F. "Extension of the SAEM algorithm to left-censored data in non-linear mixed-effects model: application to HIV dynamics models" Computational Statistics and Data Analysis, vol. 51, pp. 1562--1574, 2006.
  • Jaffrezic F., Meza C., Lavielle M., Foulley J.L. "Genetics analysis of growth curves using the SAEM algorithm" Genetics Selection Evolution, vol. 38, pp. 583--600, 2006.
  • Lavielle M., Mentré F. "Estimation of population pharmacokinetic parameters of saquinavir in HIV patients and covariate analysis with the SAEM algorithm" Journal of Pharmacokinetics and Pharmacodynamics, vol. 34, pp. 229--49, 2007.
  • Comets E, Verstuyft C, Lavielle M, Jaillon P, Becquemont L, Mentré F. Modelling the influence of MDR1 polymorphism on digoxin pharmacokinetic parameters. European Journal of Clinical Pharmacology, 63, pp. 437-49, 2007.
  • Samson A., Lavielle M., Mentré F. "The SAEM algorithm for group comparison tests in longitudinal data analysis based on nonlinear mixed-effects model" Statistics in Medicine, vol. 26, pp 4860-4875, 2007.
Fiche logiciel validé
  • Création ou MAJ importante : 15/10/10
  • Correction mineure : 21/05/19
Mots-clés
Pour aller plus loin
  • Fiches logiciel PLUME connexes : Cmake

Monolix : analyse de modèle non-linéaire à effets mixtes

Une fiche Dév Ens Sup est en relation avec cette fiche, consultez-la pour plus d'informations : Monolix
Description
Fonctionnalités générales

Monolix (pour MOdèles NOn LInéaires à effets miXtes) est un logiciel permettant l'estimation de paramètres de modèles mathématiques analytiques ou basés sur un système d'équations différentielles ordinaires dans un contexte populationnel. Le logiciel permet l'estimation des paramètres moyens dans une population d'individus ainsi que des caractéristiques des distributions aléatoires associées aux paramètres. Le domaine d'application principal est la pharmacocinétique et la pharmacodynamie des médicaments.

De nombreuses fonctionnalités sont implémentées dans Monolix :

  • estimation des paramètres du modèle avec SAEM ;
  • estimation de la vraisemblance du modèle par échantillonnage préférentiel ;
  • sorties graphiques et numériques ;
  • simulation de données ;
  • librairies de modèles (pharmacocinétiques, pharmacodynamiques, dynamiques virales).
  • MLXTRAN est un traducteur intégré à Monolix qui permet à l'utilisateur d'écrire son modèle, en particulier lorsqu'il est défini par un système d'équations différentielles ordinaires.

Contexte d'utilisation dans mon laboratoire/service

Dans le cadre de leurs recherches en pharmacologie à L'INSERM-P7 ainsi qu'à l'INRA en agronomie, génétique animale et micro-biologie.
Ce logiciel est aussi utilisé et sponsorisé par de grands groupes pharmaceutiques tels que : Johnson & Johnson, Roche, Sanofi aventis, Exprimo et Novartis.

Limitations, difficultés, fonctionnalités importantes non couvertes
  • Il n'existe actuellement pas de version serveur du logiciel.
  • il n'existe pas de version script (obligation d'utiliser le GUI)
Environnement du logiciel
Plates-formes

Unix-like, Windows et Mac OS X.

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes
  • Nonmem : logiciel équivalent à ceci près qu'il est payant. et que les algorithmes implémentés sont moins performants (basés sur une linéarisation du modèle)
Environnement de développement
Type de structure associée au développement
Eléments de pérennité

Monolix est sponsorisé par plusieurs grands groupes pharmaceutiques et 4 ingénieurs sont embauchés à temps plein sur son développement.

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur
Fiche logiciel validé
  • Création ou MAJ importante : 18/12/09
  • Correction mineure : 14/05/13

Protégé : éditeur d'ontologies, framework de base de connaissances, cartographie de système d'information

Description
Fonctionnalités générales

La plateforme Protégé, est un éditeur d'ontologies, et un framework de base de connaissances très convivial, basé sur Java.

Une ontologie, en informatique, est un ensemble structuré de savoirs dans un domaine de connaissance particulier.

Protégé offre 3 approches pour développer une ontologie :

  • l'éditeur Protégé-OWL permet de construire des ontologies pour le web sémantique (Protégé 3.4.2 et Protégé 4.0.2),
  • l'éditeur Protégé-Frames permet de construire et peupler des bases de connaissances basées sur des frames (Protégé 3.4.2),
  • l'équipe de développement de Protégé, travaille également sur l'édition d'ontologies à travers une interface web (WebProtégé 0.5 alpha).

Protégé permet d'utiliser le langage OWL, qui est le langage informatique utilisé pour modéliser des ontologies. OWL est un dialecte XML qui étend RDFS.

Protégé permet un fonctionnement en mode client/serveur avec une gestion des droits ajustables en fonction des profils souhaités.

Protégé intègre des outils de travail collaboratif comme le chat ou les annotations.

Autres fonctionnalités

Les fonctionnalités de Protégé peuvent être étendues grace à une architecture en plugin et à l'aide de l'API Java fournie. Ce qui permet, en outre, de générer automatiquement du code Java.

Protégé intègre une multitude de plugins permettant des manipulations sur les bases de connaissances crées :

  • ontoviz : pour générer un graphe au format DOT,
  • queries : pour effectuer des requêtes,
  • forms : pour mettre en forme les frames simplement,
  • ...
Interopérabilité

Depuis Protégé on peut exporter les données sous de nombreux formats :

  • CLIPS
  • HTML
  • N-TRIPLES
  • N3
  • OWL
  • RDF Schéma
  • TURTLE
  • XML
Contexte d'utilisation dans mon laboratoire/service

Protégé est surtout utilisé dans le domaine de la recherche médicale, biologique ou informatique, notamment pour le cas de modélisations conceptuelles de connaissances biomédicales. Néanmoins tout domaine de connaissance peut-être modélisé à l'aide de Protégé.

Dans notre cas, Protégé-Frames 3.4.1 a servi de framework pour développer une Description Structurée des Dépendances et des Services au CRU (ontologie d'un Système d'Information), afin notamment d'obtenir une cartographie du SI.

Limitations, difficultés, fonctionnalités importantes non couvertes

La dernière version Protégé-4.0.2 n'implémente pas les fonctionnalités de Protégé-Frames 3.4.2, car la demande ne semble pas assez forte. Néanmoins la plateforme 3.x est stable et l'équipe de développement va continuer à la maintenir dans le temps.

Environnement du logiciel
Distributions dans lesquelles ce logiciel est intégré

Ce logiciel n'est intégré dans aucune distribution GNU/Linux.

Le logiciel fonctionnant avec Java : une Java VM doit être installée. Toutefois, l'éditeur fournit également une archive contenant une Java VM compatible.

L'installation est automatique une fois l'archive récupérée sur le site de l'éditeur :

  • sh ./install_protege_3_4_1.bin sur les Unix-Like
  • Doucle-clic sous Windows et Mac-OS X
Plates-formes

Linux (32 et 64 bits), AIX, Solaris, HP-UX, Mac-OS X, Windows (32 et 64 bits) ainsi que toutes les plateformes supportant Java.

Logiciels connexes

Graphviz pour l'utilisation du plugin ontoviz (permettant la génération de graphe au format DOT).

Autres logiciels aux fonctionnalités équivalentes
  • SWOOP : gratuit, non libre (code source non diffusé)
  • KMgen : gratuit, non libre (code source non diffusé)
  • swoop : commercial, non libre (code source non diffusé)
Environnement de développement
Type de structure associée au développement

Center for Biomedical Informatics Research de la faculté de médecine de Stanford.

Eléments de pérennité

Protégé est développé depuis 1995.

  • Protégé 4.0.2, sortie le 3 décembre 2009
  • Protégé 3.4.2, sortie le 16 décembre 2009
  • WebProtégé 0.5 alpha, sortie le 14 août 2009
Références d'utilisateurs institutionnels
  • 126870 utilisateurs enregistrés
  • 17135 abonnés à la liste protégé-users
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

En dehors des listes de diffusion, wikis et autres tutoriels disponibles sur le site de l'éditeur, l'équipe de Protégé propose un support payant, pour du développement spécifique de plugin, du design de grosses bases de connaissances...

Documentation utilisateur
Divers (astuces, actualités, sécurité)

Pour utiliser l'ontologie du CRU afin de cartographier un Système d'Information : http://www.cru.fr/activites/ontologie/index

Contributions
Syndiquer le contenu