SHS

Logiciels (logiciels libres en majorité) ou ressources (liées aux logiciels) utiles aux chercheurs et enseignants dans le domaine des Sciences Humaines et Sociales (SHS)
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 26/11/10
  • Correction mineure : 14/02/12
Mots-clés

LISDQS : interpolation de données quantitatives et spatiales

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 2.0 - 15 novembre 2010
  • Licence(s) : choix en cours, contacter l'auteur
  • Support : maintenu, développement en cours
  • Concepteur(s) : Daniel Joly
  • Contact concepteur(s) : daniel.joly à univ-fcomte.fr
  • Laboratoire(s), service(s)... : ThéMA

 

Fonctionnalités générales du logiciel

LISDQS (logiciel d’interpolation de données quantitatives et spatiales) est écrit en C++ et encapsulé en JAVA. Il a été conçu pour créer, rassembler, hiérarchiser toute l’information spatiale nécessaire à l’interpolation. Le logiciel gère l’ensemble des opérations :

  • depuis l’importation des informations initiales (données résultant de l’observation et caractérisées par une localisation en X/Y et valeurs à analyser [format SHP], données géographiques en mode « raster » telles que le modèle numérique de terrain (MNT), l’occupation du sol issue de la télédétection, etc., au format GEO-TIFF ou ASCII-GRID,
  • jusqu’à l’établissement des modèles destinés à la cartographie,
  • en passant par la création du système d’information géographique sous-jacent (création et gestion des couches d’informations [variables explicatives] nécessaires aux calculs), à l’analyse statistique et géostatistique, et à l’interpolation elle-même.

Une attention toute particulière a été accordée à la création de variables explicatives originales. Outre le calcul des pentes, du rayonnement global, distance à tel ou tel objet et autres variables proposées sur la plupart des logiciels SIG, LISDQS propose des variables originales telles que, entre autres : (i) le calcul de la dimension fractale des formes topographiques ou d'occupation du sol, (ii) la profondeur des dépressions et des éminences topographiques tirées du réseau linéarisé des thalwegs et crêtes. En outre, chaque variable peut être calculée à l’intérieur de fenêtres dont le nombre et la taille sont paramétrables.

Les différentes phases de calcul et d’interpolation sont gérées automatiquement, avec un nombre aussi réduit que possible d’interventions de la part de l’utilisateur. Le logiciel est tout à la fois un SIG aux sens « programme » et une base de données. Il permet le traitement de plusieurs milliers de situations en un temps réduit.

Il propose deux méthodes d’analyse :

  • la première est fondée sur les corrélations linéaires entre la variable expliquée (à interpoler) et les variables explicatives crées par LISDQS, ou importées. Les meilleurs estimateurs de la variable à interpoler sont identifiés, puis les variables significatives au seuil de 5% sont croisées dans le cadre de régressions multiples.
  • la seconde analyse est basée sur la géostatistique.

L’opérateur choisit l’ordre dans lequel ces deux analyses s’enchaînent ; la seconde estimant les résidus obtenus à l’issue de la première étape. L’estimation en chaque point de grille résulte soit des données issues de tous les points d’observation (interpolation globale), soit des données issues des n postes les plus proches (interpolation locale). L’opérateur choisit l’une ou l’autre option. Les coefficients de la régression multiple et du krigeage sont considérés comme des opérateurs cartographiques qui permettent de restituer le champ continu de la variable à interpoler. L’opérateur a la possibilité de cartographier le résultat de l’une ou l’autre analyse, ou le modèle final résultant de la somme des estimations issues des deux étapes. Les résultats se présentent sous deux formes. Il s’agit d’abord de graphes et d’indices statistiques permettant de juger de la qualité des estimations. Il s’agit ensuite des modèles spatiaux qui peuvent être visualisés avec ou non segmentation en classes. L’export des cartes se fait au format PNG ou SVG ; l’export des modèles spatiaux se fait au format GEO-TIFF ou ASCII-GRID.

Contexte d’utilisation du logiciel

LISDQS a d’abord été utilisé dans le laboratoire ThéMA (UMR 6049) pour interpoler des variables climatiques (température, précipitation, ensoleillement, etc.) observées au sein du réseau de Météo-France. Les aires d’étude sur lesquelles les analyses ont porté s’inscrivent à différentes échelles.

L’interpolation des précipitations sur le bassin amazonien (pixels de 5 km de résolution spatiale) a été effectuée en collaboration avec les hydrologues appartenant au laboratoire LOCEAN (UMR 7159, CNRS-UPMC de l’Institut Pierre-Simon Laplace). A échelle moyenne (250 m de résolution spatiale), des applications concernant la France (Joly et al., 2007 ; 2008 ; 2010) ont été réalisées avec des économistes (CESAER, UMR 1041, INRA, AGROSUP, Dijon) et portent sur l’estimation du prix du climat (Joly et al., 2010).

Toujours à échelle moyenne (50 m de résolution), LISDQS a été utilisé sur des aires plus réduites dans le cadre de la gestion des espaces viticoles (Centre Régional d’Information Agrométéorologique, en PACA ; Institut Français de la Vigne et du Vin, en Gironde). A échelle locale très fine (1 m de résolution), le logiciel a été utilisé pour construire le champ spatial continu des températures et du vent au Spitsberg (collaboration avec des botanistes de l’Université de Tromsø, en Norvège). D’autres applications plus ponctuelles, en collaboration avec ATMO-FC, ont permis d’interpoler des polluants à échelle régionale et locale (ozone, césium).

Publications liées au logiciel
  • Joly et al., 2007 ; 2008 ; 2010
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 02/11/10
  • Correction mineure : 02/11/10
Mots-clés

ScolastiX : annotation de textes en XML

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Licence(s) : GPL
  • Etat : diffusé en beta
  • Support : non maintenu, développement en cours
  • Concepteur(s) :

    Marjorie Burghart (Histoire et Archéologie des Mondes Chrétiens et Musulmans Médiévaux)

  • Contact concepteur(s) : marjorie.burghart @ ehess.fr
  • Laboratoire(s), service(s)... : CIHAM

 

Fonctionnalités générales du logiciel

ScolastiX signifie Système collaboratif libre pour l'annotation scientifique de textes en XML. C'est une application web permettant d’accompagner la préparation d’un corpus par une équipe d’experts qui annotent et commentent les textes.

Contexte d’utilisation du logiciel

Un prototype de l’application a d’abord été développé pour la préparation d’un corpus de sermons médiévaux, analysés et balisés en XML.

Ce prototype était limité à un type de document. Une seconde campagne de développement a permis, tout en conservant les mêmes principes, de rendre l’application beaucoup plus générique (elle est maintenant ouverte à tous les types de documents), et de lui apporter un certain nombre d’améliorations techniques (par exemple, couche d’abstraction pour la base de données). Les développements ont été réalisés par Jérôme Fargier, dans le cadre de son Projet de Fin d'Etude à l’école d’ingénieurs CPE.

Publications liées au logiciel

Marjorie Burghart, « Annotation collaborative d’un corpus de documents médiévaux : outils pour l’analyse de la structure et du contenu des sermons de Jacques de Voragine », Le Médiéviste et l’ordinateur, 43, 2004
http://lemo.irht.cnrs.fr/43/43-11.htm

Fiche logiciel à valider
  • Création ou MAJ importante : 18/10/10
  • Correction mineure : 03/09/12
  • Rédacteur de la fiche : Hervé Parmentier - Environnement Ville Société (ENS de Lyon, Université de Lyon III, CNRS)
  • Responsable thématique : Maud Ingarao (Institut d'Histoire de la Pensée Classique - ENS Lyon)
Mots-clés
Pour aller plus loin
  • Mots-clés principaux : SIG
Fiche en recherche de relecteurs
Cette fiche est en recherche de relecteurs. Si vous êtes intéressé(e)s, contactez-nous !

OGR2GUI : conversion de formats de données spatiales (géographie)

Ce logiciel est en cours d'évaluation par la communauté PLUME. Si vous utilisez ce logiciel en production dans notre communauté, merci de déposer un commentaire.
Description
Fonctionnalités générales

OGR2GUI est une interface graphique du logiciel OGR2OGR. Il permet de convertir entre eux les fichiers de données vectoriels des Systèmes d’information géographique (SIG) tels que pour les logiciels QGis, GRASS, MapInfo, ArcGIS,....
L'idée est née de la société Inventis Géomatique, implantée au Canada, afin d'offrir aux utilisateurs (compagnies forestières, municipalités, , comités, entreprises privées, etc.), une alternative gratuite aux produits commerciaux dédiés à la transformation et à la manipulation de données cartographiques numériques.
Cette interface graphique est disponible sous Windows (sans ligne de commande), mais aussi sous Linux à l'usage des personnes travaillant l' OGR en ligne de commande.
Elle permet la conversion de différents formats de la bibliothèque OGR, la conversion de fichiers multiples en batch et la reprojection de données géographiques vecteurs.

Autres fonctionnalités

Possibilité de réaliser une requête SQL pendant la conversion. La plupart des fichiers convertibles par OGR2GUI sont des bases de données, ainsi il est possible de ne conserver que certains objets en fonction de critères de sélection ou que certains champs dans les fichiers de sortie.
Détail appréciable pour ceux qui veulent s’initier à la ligne de commande ou faire des scripts, OGR2GUI affiche dans une zone de texte, en bas de la fenêtre principale, la ligne commande équivalente aux paramètres qui ont été rentrés graphiquement.

La version 0.6 intègre les nouveautés suivantes :

  • La migration de l’interface graphique vers la plate-forme QT de Nokia
  • Le support pour les formats de bases de données tels que Oracle Spatial, PostgreSQL, MySQL, SQLite et les connections ODBC
  • L’ajout des formats GPX, GMT, GeoJSON, Geoconcept et FME Objects Gateway
  • Une nouvelle adresse pour le téléchargement et les échanges entre les utilisateurs : www.ogr2gui.ca

ogr2gui est désormais disponible sans installateur Windows (.exe seulement). Il supporte aussi le format BNA (Boundary Files). Vous pouvez également convertir la totalité d'un répertoire en cliquant sur l'onglet "Folders.

Interopérabilité

Tous les formats de la liste suivante sont supportés : http://www.gdal.org/ogr/ogr_formats.html

Contexte d'utilisation dans mon laboratoire/service

Conversion et reprojection de données géographiques SIG.
Programmation SQL.

Limitations, difficultés, fonctionnalités importantes non couvertes

Pas de prise en compte de format raster actuellement sous la version 0.6
Problème installation version 0.6

Environnement du logiciel
Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

Inventis Géomatique
926 Notre-Dame Centre, suite 102
Trois-Rivières(Qc) CANADA
G9A 4W8

Eléments de pérennité

Nombreux utilisateurs

Références d'utilisateurs institutionnels

En France : Laboratoire Biogéophile et Laboratoire CRENAM, UMR 5600 EVS.
La diffusion est internationale : les pays francophones (Québec, France, Suisse et Belgique). ogr2gui est également utilisé par des universités canadiennes, des agences du gouvernement américain, des organismes italiens et polonais de même que des sociétés privées en Allemagne, en Espagne et en Amérique du Sud.

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur
Contributions

Implication dans le développement de l'application, contact : info [at] inventis [dot] ca.

Fiche logiciel validé
  • Création ou MAJ importante : 09/10/12
  • Correction mineure : 09/10/12
  • Rédacteur de la fiche : Clément Plancq - Laboratoire de Linguistique Formelle (CNRS)
  • Relecteur(s) : Maud Ingarao (Institut d'Histoire de la Pensée Classique - ENS Lyon)
    Pascal Dayre (IRIT)
  • Responsable thématique : Raphaël Tournoy (Centre pour la Communication Scientifique Directe)
Mots-clés

eXist-db : gestionnaire de base de données XML native

Description
Fonctionnalités générales

eXist-db est un système de gestion de base de données XML.
Il offre un stockage indexé de données XML et permet leur interrogation avec XQuery.
eXist-db est un logiciel libre écrit en Java, il a été fondé par Wolfgang Meier en 2000.

eXist-db est principalement utilisé dans le cadre d'applications web. Il peut être utilisé comme un serveur de base de données indépendant, déployé dans une application web ou intégré dans une application Java.

eXist-db supporte de nombreux standards :

  • Standards XML
    • XQuery 1.0
    • XPath 2.0
    • XSLT 1.0 ou XSLT 2.0
    • XUpdate
    • XForms
  • APIs
    • XML:DB
    • XML-RPC
    • REST
    • SOAP

La version stable actuelle est la 1.4.2
La version 2.0 est sur les rails pour devenir la prochaine version stable

Autres fonctionnalités

Un des intérêts d'eXist-db réside dans ses index dont l'implémentation repose sur une architecture modulaire. Cela rend possible l'utilisation d'index existants comme greffons (index n-gram, index d'informations spatiales de type GML) ou le développement de nouveaux types d'index.
Un fichier de configuration permet aussi de créer des index personnalisés pour chacune des collections de documents de la base. Ainsi, en plus des index par défaut, l'utilisateur pourra ajouter un index pour un élément ou un attribut XML fréquemment utilisé dans les interrogations opérées sur la base. Ce type d'index permet des gains de temps d'exécution notables.

eXist offre une bibliothèque de fonctions fournie (voir la page XQuery Function Documentation). Il est assez facile pour l'utilisateur d'y ajouter ses propres fonctions sous la forme de modules écrits soit directement en XQuery soit en Java.

eXist-db offre aussi des mécanismes de sauvegarde/restauration et de vérification de l'intégrité de la base.

Interopérabilité

eXist-db repose sur le format XML, même si des données binaires peuvent être stockées dans une base eXist seules les données au format XML seront indexées et interrogeables.
En sortie, les données XML peuvent être transformées avec XQuery ou XSLT en XML, HTML, JSON, LaTeX, ...

L'implémentation des interfaces REST, SOAP, WebDAV, XMLRPC rend eXist-db interopérable avec un grand nombre de logiciels.

Contexte d'utilisation dans mon laboratoire/service

eXist-db est utilisé dans le cadre d'applications web de publication et d'interrogation de données linguistiques.
Nous utilisons eXist-db en test depuis la version 1.0 et en production depuis la version 1.2.
eXist-db est un logiciel très facile à mettre en œuvre et à utiliser. A ce titre il est souvent utilisé dans un contexte d'enseignement d'XQuery, XPath, ...

Cette facilité fait parfois oublier que son utilisation en production demande des efforts de configuration et d'optimisation. Le choix du mode de déploiement et la configuration des index notamment sont des facteurs importants d'optimisation.
Les changements apportés avec la version 1.4 ont rendu le logiciel beaucoup plus performant, l'intégration de Lucene (cf fiche PLUME) rend la recherche plein texte beaucoup plus efficace.

Limitations, difficultés, fonctionnalités importantes non couvertes

eXist n'implémente pas les fonctions 'import schema' et 'validate' de la spécification XQuery 1.0 (seule entorse à la spécification).

Environnement du logiciel
Plates-formes

eXist-db 1.4 nécessite J2SE 5 pour fonctionner.

Logiciels connexes

oXygen. eXist-db est une des bases de données qui peut être utilisée avec l'éditeur XML oXygen voir http://www.oxygenxml.com/eXist_support.html
Lucene

Autres logiciels aux fonctionnalités équivalentes

BaseX (open source)
Oracle Berkeley DB XML (open source)
MarkLogic Server (propriétaire)

Environnement de développement
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

http://sourceforge.net/mail/?group_id=17691 (anglais) : Liste de diffusion très active

Documentation utilisateur

Linux et les choses : site d'information sur l'emploi des logiciels libres dans la recherche et l'enseignement en sciences humaines

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 27/07/10
  • Correction mineure : 27/07/10
  • Auteur : Christophe Masutti (Institut de Recherches Interdisciplinaires sur les Sciences et la Technologie - Departement d'histoire des sciences de la vie et de la santé)
  • Responsable thématique : Maud Ingarao
Mots-clés

Linux et les choses : site d'information sur l'emploi des logiciels libres dans la recherche et l'enseignement en sciences humaines

Site web créé en 2006 par Christophe Masutti, chercheur, pour partager avec ses collègues et connaissances ses usages des logiciels libres et de GNU/Linux - en particulier dans le domaine des sciences humaines - Linux et les choses est une aventure éditoriale qui s'est inscrite dans la durée et compte aujourd'hui près de 200 pages et un millier de visiteurs mensuels. On y trouve des fiches de présentation de logiciels, de la documentation sur les logiciels libres et des articles de réflexion sur le libre et ses usages en sciences humaines et sociales.

Comme il est écrit dans son édito, le site est parti d'une réflexion sur les usages des logiciels en sciences :

Pourquoi produire des connaissances dont la finalité est d'être partagées, par des outils informatiques qui, eux, ne sont pas libres de l'être ?

Pourtant Linux et les choses ne prétend pas à l'exhaustivité. Les logiciels libres sont depuis fort longtemps connus dans différentes disciplines, y compris dans les sciences humaines. L'objectif est d'orienter les pratiques professionnelles qui n'ont pas encore saisi l'avantage des logiciels libres, en termes de coût, d'intégration et d'efficacité. L'accent est mis plus particulièrement sur les outils d'écriture et de communication.

S'adressant à l'utilisateur, et partant de l'expérience personnelle de l'auteur, le site propose des notices courtes sur des logiciels libres et renvoie systématiquement le lecteur au site officiel et aux articles déjà présents sur Internet. Linux et les choses agit donc à la fois comme un signalement et comme une veille stratégique. On notera de même la présence d'un modèle de thèse en sciences humaines au format LaTeX, nommé Bredele, ainsi que plusieurs notices plus complètes que les autres selon le degré de leur utilisation par l'auteur (par exemple: un fiche sur Mutt, ou encore cette longue liste de logiciels de gestion bibliographique libres).

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 16/07/10
  • Correction mineure : 17/07/13
Mots-clés

TreeCloud : générer des nuages arborés à partir d'un texte

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.

 

Fonctionnalités générales du logiciel

TreeCloud permet de générer des nuages arborés à partir d'un texte, c'est à dire des nuages de mots disposés autour d'un arbre qui indique leur proximité dans le texte.

Contexte d’utilisation du logiciel

La principale utilité des nuages arborés construits par TreeCloud est de donner rapidement un aperçu du contenu d'un texte. Il est possible de les utiliser pour une analyse plus en profondeur de textes, au sein d'une démarche textométrique (analyse de texte assistée d'outils informatiques et statistiques). Le nuage arboré sert alors à susciter, formaliser et étayer des hypothèses de travail, comparer des textes selon leur représentation arborée, hiérarchiser l'utilisation d'autres outils textométriques, et représenter les résultats de l'analyse.

Publications liées au logiciel

Philippe Gambette et Jean Véronis : Visualising a Text with a Tree Cloud, In Locarek-Junge H. and Weihs C., editors, Classification as a Tool of Research, Proc. of IFCS'09 (11th Conference of the International Federation of Classification Societies) Studies in Classification, Data Analysis, and Knowledge Organization 40, p. 561-570, 2010.

Delphine Amstutz et Philippe Gambette : Utilisation de la visualisation en nuage arboré pour l'analyse littéraire, Statistical Analysis of Textual Data (Proc. of JADT'10), p. 227-238, 2010.

Philippe Gambette, Nuria Gala et Alexis Nasr : Longueur de branches et arbres de mots, Corpus 11, p. 129-146, 2012.

William Martinez et Philippe Gambette : L'affaire du Médiator au prisme de la textométrie, Texto !, à paraître, 2013.

Fiche logiciel validé
  • Création ou MAJ importante : 19/04/10
  • Correction mineure : 02/03/13
Mots-clés

Fedora Commons : système de gestion et entrepôt de contenus numériques

  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Téléchargement
  • Version évaluée : 3.2.1
  • Langue(s) de l'interface : anglais
  • Licence : autre

    FedoraCommons intègre un certain nombre de technologies comme un serveur TOMCAT, un utilitaire SAXON et bien d'autre encore. Chacune de ces technologies possède une licence. Elles sont toutes décrites dans l'adresse ci-dessus.

Description
Fonctionnalités générales

Ce logiciel permet d'agréger, à l'intérieur d'objets logiques, des fichiers de données de tout format. C'est un logiciel comparable à une base de données et très rudimentaire quant aux interfaces d'accès aux données. L'accès est nettement orienté pour les machines et les programmes à l'aide des APIs. Pour utiliser FedoraCommons, il faudra donc forcément rajouter une interface cliente qui intègre la création, la modification, la suppression et la consultation des données, éventuellement une authentification si une gestion des droits d'accès est nécessaire. Pour cela vous pourrez vous appuyer sur des services web ou bibliothèques répondant aux standards actuels (JAVA, REST, SOAP, OAI, Dublin Core, etc...).

L'application typique peut être la gestion de livres dans une bibliothèque, chaque livre étant un objet logique possédant des métadonnées (titre, auteur, ISBN, éditeur, nombre de pages, genre, collection, etc...), des données texte associées (quatrième de couverture, extraits, critiques, etc...) et des données numériques associées (image de la couverture, interview de l'auteur, etc...).

Autres fonctionnalités

Pour FedoraCommons, chaque objet est décrit dans un fichier XML. Une donnée proprement dite (des métadonnées, une image, un fichier son, une vidéo, etc...) est un datastream d'un objet. Chaque objet peut contenir une infinité de datastreams qui chacun, à l'intérieur de l'objet, possède un identifiant unique. Il existe quelques datastreams réservés, comme DC qui gère les métadonnées Dublin Core ou RELS-EXT qui gère des relations entre objets décrites au format RDF.

Tous les autres datastreams peuvent être n'importe quelle donnée numérique. FedoraCommons permet de les gérer de 4 manières différentes:

  • Stockées directement dans le repository (1). C'est le cas le plus simple. L'avantage est une plus grande maîtrise du fichier, notamment pour la gestion des droits d'accès. Mais cela implique d'avoir suffisamment de capacité de disque et une garantie de pérennité quant à la qualité de conservation.
  • Données XML stockées en interne. Les données fournies doivent être écrites en XML. Elles seront stockées directement dans le fichier descriptif de l'objet.
  • Référence externe à un fichier. Ce type de datastream permet de gérer des fichiers stockés n'importe où sur un réseau accessible par URL et de faire gérer ce fichier par FedoraCommons comme un datastream stocké directement dans le repository (1). Lorsque cette donnée sera demandée, elle transitera entièrement par le serveur lors de sa retransmission au demandeur, qui ne verra donc pas que le stockage de la donnée est déporté.
  • Référence redirigée vers un fichier. Ce datastream est aussi une URL vers un fichier sur un réseau, mais le demandeur sera redirigé vers l'adresse. Aucune donnée ne passera par le serveur FedoraCommons.

En fonctionnement de base, FedoraCommons demande peu d'installation: un accès à une base de données (MySQL, PostgreSQL, Oracle, Microsoft SQL ou une base intégrée Derby) et un espace disque pour stocker les données (le repository (1)). Voici les fonctionnalités les plus utiles à regarder dans un premier temps:

  • Installation du serveur: toutes les informations pour démarrer avec FedoraCommons se trouvent dans le lien suivant et toute sa sous-arborescence: Installation and Configuration Guide
  • XACML (2): sécurisez l'accès à vos données. Ces fichiers définissent les règles d'accès à vos données. Elles peuvent être globales à votre serveur, mais elles peuvent aussi ne concerner que la façon d'accéder à un certain datastream d'un objet précis. Aidez vous des liens ci-dessous pour écrire vos règles:

  • Les logiciels administrateurs: exécutable java ou services web, ces programmes vous permettront d'administrer ou de consulter vos données... avant d'utiliser les API pour les gérer automatiquement. Ces administrateurs ont principalement une fonction d'outil de maintenance: ils sont rudimentaires, pas forcément ergonomiques et pas configurables.

  • API-A et API-M: services web donnant accès à l'administration du serveur par des programmes manipulant SOAP, REST, ... Documentation officielle
  • Les bibliothèques JAVA: il suffit de récupérer les fichiers .jar d'un serveur installé pour intégrer toutes les fonctions JAVA de FedoraCommons. Vous trouverez la description de ces fonctions dans le JAVADoc
  • RDF: à l'aide du datastream RELS-EXT (3), créez des liens entre vos objets. Vous trouverez dans le lien suivant les informations pour vous familiariser avec le RDF: Digital Object Relationships


(1) le repository est l'emplacement où FedoraCommons stocke ses données. Par défaut c'est sur le disque où est installé le serveur, mais cela peut être un endroit déporté. Il est possible d'utiliser les systèmes déportés comme iRods (dans le cas du projet d'archivage pérenne d'ADONIS), mais aussi SRB, Akubra, Amazon's Simple Storage System (S3) ou Sun Honeycomb.


(2) La description de FedoraCommons qui est faite ici concerne la version 3.2.1 Une version 3.3 est déjà sortie et intègre notamment une gestion approfondies des droits d'accès, Fedora Security Layer (FeSL).


(3) Dans la version 3.3 de FedoraCommons, il existe un autre datastream réservé (RELS-INT)servant aux relations entre datastreams à l'intérieur de chaque objet.

Contexte d'utilisation dans mon laboratoire/service

FedoraCommons est utilisé dans le cadre du projet d'archivage pérenne des données numériques en SHS, à l'initiative du tge-ADONIS ( http://www.tge-adonis.fr/ ) et avec une mise en production dans le premier trimestre 2010. Prévu pour gérer des archives numériques à grande échelle et grâce à sa multitude de fonctionnalités et de standards, il peut facilement s'adapter à de nombreuses utilisations: gérer des livres dans une bibliothèque ou des collections d'œuvres d'arts dans un musée; faciliter la collaboration d'étude ou de recherche dans tous les domaines dont la base de travail peut être numérisée (enregistrement sonore ou vidéo, reconstitution archéologique, manuscrit, etc...).

Limitations, difficultés, fonctionnalités importantes non couvertes

Dans un premier temps, j'ai voulu utiliser FedoraCommons avec les bibliothèques JARGON (https://www.irods.org/index.php/Fedora) pour déposer directement les données dans le système iRods. J'ai eu trop de problèmes (pertes de connexion, impossibilité de reconstruire le système...) pour le recommander... J'utilise actuellement un montage fuse d'un répertoire iRods. Cela n'implique aucune configuration particulière du serveur FedoraCommons.

Environnement du logiciel
Plates-formes

FedoraCommons n'est développé qu'en langue anglaise: documentation et logiciel. Il fonctionne en utilisant une version de JDK (Java SE Development Kit) supérieure ou égale à 5. De ce fait, il peut être installé sur tous les systèmes supportant JAVA: LINUX, UNIX, Windows, Mac...

Autres logiciels aux fonctionnalités équivalentes

DSpace: http://www.dspace.org/ et fiche PLUME http://www.projet-plume.org/fr/fiche/dspace . Il plus orienté pour une utilisation personnelle. Je ne l'ai pas essayé, mais c'est apriori l'équivalent en version personnelle de FedoraCommons. Les deux logiciels fonctionnent dans la même communauté. La licence est une "BSD distribution license"

Environnement de développement
Type de structure associée au développement

FedoraCommons est développé par une communauté internationale: http://www.fedora-commons.org/about/supporters
L'historique du projet est disponible sur le lien suivant: http://www.fedora-commons.org/about/history

Eléments de pérennité

Actuellement, FedoraCommons est peu utilisé en France, mais un nombre croissant d'institutions dans le monde l'utilise: http://www.fedora-commons.org/about/examples Sa pérennité est garantie.

Références d'utilisateurs institutionnels
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur

Racine de la quasi intégralité de la documentation de FedoraCommons: http://fedora-commons.org/confluence/display/FCR30...

Divers (astuces, actualités, sécurité)
Contributions
Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 04/04/10
  • Correction mineure : 23/09/10
Mots-clés

Dinah : plateforme philologique pour la construction de documents multistructurés

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Système : UNIX-like, Windows, MacOS X
  • Etat : utilisé en interne, en développement
  • Support : non maintenu, développement en cours
  • Concepteur(s) : Pierre-Edouard Portier
  • Contact concepteur(s) : pierre-edouard.portier@ens-lsh.fr
  • Laboratoire(s), service(s)... : LIRIS

 

Fonctionnalités générales du logiciel

Dinah n'est pas vraiment un logiciel mais une plate-forme de recherche.

Des usages différents d'un même document peuvent introduire simultanément des structures concurrentes.
Les travaux qui s'intéressent à la représentation des documents multi-structurés se focalisent sur le problème de la représentation des quasi-hiérarchies, mais ne s'occupent pas de la construction du document c'est-à-dire du processus qui fait apparaitre la multistructuralité.
Nous défendons l'hypothèse selon laquelle l'apparition d'une structure locale de graphe au sein de ce qui était un arbre fait signe de la nécessité de distinguer deux structures au lieu d'une. C'est ce que permet notre interface de transcription.
Par ailleurs, pour contrôler, documenter et justifier l'apparition des vocabulaires structurants, nous proposons une représentation chronologique de la trace des activités d'annotation. Cette trace est annotable. Des débats argumentés peuvent ainsi naître au sujet d'usages concurrents.

Contexte d’utilisation du logiciel

Dans le cadre de notre doc­to­rat (Allocation De Recherche attribuée dans le cadre du Cluster 13, mis en place et soutenu par la Région Rhône-Alpes) dirigé par Sylvie Calabretto (LIRIS), nous tra­vaillons avec les cher­cheurs qui ana­ly­sent l’œuvre de Jean-Toussaint Desanti, plus par­ti­cu­liè­re­ment avec David Wittmann en séan­ces de tra­vail heb­do­ma­dai­res à l’Institut Desanti.

Le maté­riau prin­ci­pal d’étude, les fac-simi­lés numé­ri­ques de l’ensem­ble des docu­ments manus­crits de Desanti légués à l’École, se com­pose de brouillons pré­pa­ra­toi­res d’œuvres éditées, d’iné­dits, de cours et pré­pa­ra­tions de cours, etc. Les besoins sont le reclas­se­ment, la trans­crip­tion et l’anno­ta­tion col­la­bo­ra­tive du cor­pus de docu­ments manus­crits.

Lire la suite ici : http://institutdesanti.ens-lyon.fr/spip.php?rubriq...

Publications liées au logiciel

Portier, P. and Calabretto, S. 2009. Creation and maintenance of multi-structured documents. In Proceedings of the 9th ACM Symposium on Document Engineering (Munich, Germany, September 16 - 18, 2009). DocEng '09. ACM, New York, NY, 181-184. DOI= http://doi.acm.org/10.1145/1600193.1600233

Portier, Pierre-Edouard, and Sylvie Calabretto. “Methodology for the construction of multi-structured documents.” Presented at Balisage: The Markup Conference 2009, Montréal, Canada, August 11 - 14, 2009. In Proceedings of Balisage: The Markup Conference 2009. Balisage Series on Markup Technologies, vol. 3 (2009). doi:10.4242/BalisageVol3.Portier01.

Toutes les publications de Pierre-Edouard Portier : http://liris.cnrs.fr/membres/?idn=peportie&onglet=...

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 12/03/10
  • Correction mineure : 26/07/13
Mots-clés

Lodel : logiciel d'édition électronique - CMS orienté publication de revues électroniques

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : 0.9 - 01/04/2010
  • Licence(s) : GPL
  • Etat : validé (au sens PLUME), diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Ghislain Picard, Marin Dacos, Luc Santeramo, Gautier Poupeau, Jean Lamy, Bruno Cénou, Mikaël Cixous, Sophie Malafosse, Inès Secondat de Montesquieu, Jean-François Rivière, Pierre-Alain Mignot
  • Contact concepteur(s) : lodel@lodel.org
  • Laboratoire(s), service(s)... : CLEO

 

Une fiche logiciel décrit plus en détail ce développement, consultez la pour plus d’informations : Lodel
Fonctionnalités générales du logiciel

Lodel est un logiciel d’édition électronique simple d'utilisation et adaptable à des usages particuliers. Il appartient à la famille des gestionnaires de contenus (en anglais, Content management system, CMS) et s’est spécialisé dans l’édition de textes longs et complexes, s’inscrivant dans un environnement éditorial très structuré.

Lodel est particulièrement respectueux des conventions de l’édition scientifique, telles que les notes de bas de page, la structure du texte, les divers jeux de caractères correspondant à des langues non latines, les signes diacritiques, les petites capitales, les espaces insécables, etc.

Les documents à publier peuvent être préparés dans un logiciel de traitement de texte (Word, OpenOffice.org) en local ou édités directement en ligne. Lodel utilise les styles de paragraphe (par exemple : titre, résumé, auteur) pour fabriquer automatiquement les sommaires et les index. La liste des styles supportés est extensible et configurable. Lodel reconnaît les fichiers issus de MS Word (.doc) et OpenOffice.org 1 (.sxw). A terme, il sera capable d’interpréter également des fichiers issus de MS Word 2007 (.docx) et OpenOffice.org 2 et 3 (.odt).

La plupart des logiciels de publication sur le web définissent a priori les objets éditoriaux dont ils permettent la manipulation. Il n’est souvent pas possible pour l’utilisateur de définir ses propres objets éditoriaux, ceux qui correspondent aux différents types de contenus qu’il souhaite publier. Souhaite-t-il utiliser des rubriques plutôt que des parties, des notes et des articles, et non pas des brèves ? Dans la plupart des cas il est contraint par le logiciel et doit procéder à une gymnastique intellectuelle par laquelle il contraint ses propres objets éditoriaux à entrer dans la grille et le vocabulaire défini par le logiciel qu’il utilise. Lodel 0.8 a été conçu avec l’objectif de répondre à cette contrainte. Il permet en effet à l’administrateur du site de définir les entités qu’il veut utiliser, de choisir les champs qui permettent de les décrire, de déterminer leur comportement et de les subdiviser en types. L’ensemble de ces données correspond à un « modèle éditorial » dans Lodel. Le logiciel permet d’ailleurs d’exporter, importer, partager et modifier les modèles éditoriaux.

Contexte d’utilisation du logiciel

L'intégralité de la plateforme http://www.revues.org tourne sous Lodel.
L'EHESS, l'Agence Universitaire de la francophonie, l'École centrale de Lyon, l'ENS-LSH, les universités de Poitiers, Provence, Liège, Limoges et plusieurs maisons des sciences de l'homme sont connus pour utiliser Lodel pour publier leur site de revue.

Publications liées au logiciel

Présentation poster aux JRES 2009 : http://leo.hypotheses.org/3360.

Fiche logiciel validé
  • Création ou MAJ importante : 10/07/13
  • Correction mineure : 10/07/13
  • Rédacteur de la fiche : Julie Josse - un des concepteurs du logiciel - Laboratoire de mathématique appliquée (AGROCAMPUS OUEST)
  • Relecteur(s) : Vincent Miele (LBBE)
    Delphine Charif (LBBE)
  • Contributions importantes : François Husson
  • Responsable thématique : Christelle Dantec (CRBM)
Mots-clés
Pour aller plus loin

FactoMineR : package du logiciel R dédié à l'analyse de données

Une fiche Dév Ens Sup est en relation avec cette fiche, consultez-la pour plus d'informations : FactoMineR
Description
Fonctionnalités générales

FactoMineR est un package du logiciel libre R dédié à l'analyse de données.

Il permet de réaliser les méthodes classiques (ACP, AFC, ACM, classification) et avancées (AFM, AFM Hiérarchique, AFM Duale).

De nombreux indicateurs et sorties graphiques sont disponibles.

Toutes les analyses peuvent être effectuées à l'aide d'un menu déroulant convivial.

La gestion des données manquantes en ACP, ACM et AFM est possible grâce à l'utilisation conjointe du logiciel libre R missMDA.

Interopérabilité
  • Il peut prendre en entrée des extensions csv, txt, xls.
  • Échanges possible avec Excel, SPSS, SAS, langage SQL.
Contexte d'utilisation dans mon laboratoire/service
  • FactoMineR est utilisé aussi bien en recherche qu'en enseignement et développement.

  • Il est utilisé par de nombreux organismes de recherche, des étudiants de différentes filières en France comme à l'étranger (dans plus de 70 pays).

  • FactoMineR s'adresse à un public aussi bien de statisticiens que de chercheurs ou étudiants d'autres disciplines scientifiques.

Environnement du logiciel
Plates-formes

Toutes les plates-formes

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes

Il existe un certain nombre de packages R dédiés aux analyses statistiques multivariées. Ces packages ont chacun leurs domaines d'application. Une brève revue est disponible à cette adresse: http://cran.r-project.org/web/views/Multivariate.html

Parmi ces packages, on peut citer deux packages de référence en écologie qui implémentent aussi les fonctions de bases en analyses multivariées (ACP, AFC, AD, ACM, ...) :

  • ade4 (http://pbil.univ-lyon1.fr/ADE-4/) qui propose des méthodes exploratoires et euclidiennes pour l'analyse des données en écologie (même point de vue géométrique que FactoMineR). Il dispose également d'une interface graphique ade4TkGUI. Une des spécificités d'ade4 est qu'il propose des méthodes pour les analyses k-tableaux ou encore des méthodes pour le couplage de tableaux (pcaiv, coinertie) toutes documentées dans des fiches techniques et thématiques.

  • vegan (http://cran.r-project.org/web/packages/vegan/index...), qui propose des méthodes d'analyses pour l'ecologie des communautés.

Dans ce contexte, la spécificité de FactoMineR est de proposer des méthodes d'analyses factorielles "avancées" non implémentées dans les autres packages. Par exemple : HCPC (combinant des méthodes de clustering), AFMH (analyse factorielle multiple hiérarchique) ou GPA (analyse procustéenne généralisée). Ce package propose aussi des sorties graphiques en 3D.

Environnement de développement
Type de structure associée au développement
Références d'utilisateurs institutionnels

Université de Rennes 2, Agrocampus, INRA, CNRS, IFREMER, CIRAD, L'OREAL, DANONE, SOREDAB, Unioversity of PRINCETON, Université de Barcelone, Universidad Nacional de la Patagonia, Agence de Conseil et de Recherche Océanographiques.....

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

Groupe Google : factominer-users [at] googlegroups [dot] com

Documentation utilisateur
Contributions

Envoyer un mail à husson [at] agrocampus-ouest [dot] fr

Syndiquer le contenu