Guide laboratoire pour recenser ses développements logiciels

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 14/09/09
  • Correction mineure : 20/04/12

Guide laboratoire pour recenser ses développements logiciels

Cet article n'est pas un document officiel d'un organisme ou d'une autre entité. Il s'adresse principalement aux responsables de laboratoires, mais aussi aux chercheurs, développeurs et responsables des tutelles qui souhaitent mettre en place ou améliorer les procédures de recensement des logiciels de recherche (logiciels libres et logiciels propriétaires) développés dans le laboratoire (ou l'ensemble des laboratoires d'une tutelle).
Les logiciels sont devenus des éléments principaux dans les processus de recherche, aussi bien comme outil que comme résultat. Améliorer leur référencement dans le laboratoire est le premier pas pour leur mise en valeur.
L'auteur principal de cet article est Teresa Gomez-Diaz, chargée du référencement des développements de son laboratoire LIGM et responsable thématique PLUME, mais les procédures présentées ont été étudiées avec Pascal Janots, responsable du SAIC de l'UPEMLV (service de valorisation de la recherche de l'université Paris-Est Marne la Vallée).
D'autres ont ensuite relu et complété : Jean-Luc Archimbaud (UREC), Geneviève Romier (UREC), Nathalie Rousse (INRA).
D'autres contributions sur ce texte sont souhaitables, merci de contacter l'auteur ou d'ajouter un commentaire.
Note : ce texte se veut auto-contenu, mais les lecteurs sont supposés connaître le contenu de la FAQ PLUME Licence & copyright pour les développements de logiciels libres de laboratoires de recherche Fiche Plume.

Autres documents PLUME

Ce document est une des fiches d'information et de recommandations rédigées par des responsables thématiques PLUME et destinées aux développeurs (et personnes en charge de la valorisation) dans les laboratoires de recherche et les universités. Les autres sont :

Introduction

L'évaluation d'un laboratoire de recherche s'effectue sur la base du rapport scientifique qui présente les activités de recherche du laboratoire pendant les 4 dernières années. Une grande partie de ce rapport consiste à énumérer les références des publications produites par les membres du laboratoire, généralement classées en : articles de revues, actes de conférences et autres communications, livres et chapitres de livres, thèses et habilitations, divers.
De plus les laboratoires disposent en général de bons outils pour gérer une telle liste bibliographique, ils peuvent en particulier utiliser le serveur HAL.
Par contre, pour les logiciels, il n'y a aucun outil connu autre que celui proposé par le projet RELIER de PLUME. Or, les logiciels sont devenus des éléments principaux dans le développement de la recherche, aussi bien comme outil que comme résultat. Améliorer leur connaissance est le premier pas pour leur mise en valeur. L'objectif de ce document est ainsi de proposer des procédures pour la gestion de la liste de logiciels, souvent libres mais pas uniquement, produits par un laboratoire de recherche. Ces procédures peuvent être aussi étendues aux bases de données, souvent produites et utilisées dans les laboratoires de recherche (données linguistiques, astronomiques, biologiques, ...). En effet les problèmes qui se posent avec ces bases de données (droits d'utilisation, références, citations, ...) sont de même nature que ceux que nous avons rencontrés avec les logiciels.
Le concept de production scientifique d'un laboratoire doit donc être élargi pour tenir compte de ces autres productions.

Les logiciels d'un laboratoire

Dans ce document, on entend par logiciel du laboratoire tout programme ou fragment de programme utile pour faire avancer la recherche, au sens large, et qui a été produit avec la participation d'un ou plusieurs membres du laboratoire. Il arrive souvent que des publications de recherche soient associées à un logiciel. Selon l'intérêt et la politique du laboratoire, on peut englober les logiciels à l'état de projet (logiciels en préparation, non encore terminés) et les logiciels 'utilitaires' développés au laboratoire pour améliorer le travail en interne (par exemple un outil de gestion de bibliographie).
Cette définition incite à la comparaison entre logiciel de recherche et article de recherche, mais cela ne se fait pas sans difficulté. Comment mettre dans la même balance un logiciel qui implémente un algorithme pour étude et amélioration et un livre élaboré après des longues années avec l'intervention de plusieurs personnes ? Mais en fait, cette difficulté existe aussi entre les diverses catégories des publications de recherche : comment comparer un article préparé en quelques semaines à un livre longuement élaboré ? Le point clé est dans la bibliographie fournie par le laboratoire : la comparaison ne se fait pas, la référence de l'article et du livre sont données.
Donnons donc aussi une référence pour les logiciels. De façon similaire à celle d'un article, la référence logiciel doit contenir la liste de ses auteurs, une date, mais aussi un numéro de version, une licence, une adresse et d'autres informations clés pour identifier le logiciel.
L'élaboration de la liste de logiciels d'un laboratoire est un élément fondamental de sa politique scientifique : cette liste permet de mesurer la production logicielle et permet l'évaluation de la diversité des productions. Cette liste deviendra un élément clé dans l'évaluation d'un laboratoire, mais aussi dans la détermination de son futur stratégique.

Référencer les logiciels libres et les autres

Rappelons qu'un logiciel dit libre respecte les 4 libertés mentionnées, par exemple, par la FSF :

  • liberté d'exécuter le logiciel (utilisation à l'infini),
  • liberté d'étudier le fonctionnement (disponibilité du code),
  • liberté de redistribuer des copies,
  • liberté d'améliorer le logiciel et de publier ces améliorations.

On reconnait un logiciel libre par la présence d'une licence qui indique ce statut. Un logiciel qui n'est pas libre est dit propriétaire. Plus d'informations sont données dans la FAQ Fiche Plume Licence & copyright pour les développements de logiciels libres de laboratoires de recherche.
Les logiciels propriétaires d'un laboratoire de recherche font souvent l'objet de collaborations avec des partenaires non-académiques ce qui conduit parfois à des contrats avec ces partenaires, et souvent, ces contrats sont gérés par les services de valorisation (du CNRS, SAIC, ...) des établissements. Il n'est donc pas très difficile (en principe) d'obtenir la liste des contrats, mais une autre chose est d'obtenir la liste des logiciels qui ont abouti à la fin de ces contrats.
Faisons ici une petite parenthèse pour indiquer deux types de logiciels propriétaires, qui se trouvent parfois dans les laboratoires : ceux qui font l'objet de licences propriétaires et ceux qui ne sont pas accompagnés de licence (ou logiciel public sans licence). La diffusion d'un logiciel sans licence est à éviter.

Il est en général plus difficile d'obtenir la liste des logiciels libres. À notre connaissance, très peu de laboratoires peuvent produire une telle liste, ces logiciels ne se recensent pas systématiquement, les chercheurs ne les mentionnent parfois même pas dans leurs rapports de recherche. Or comme nous l'avons déjà souligné, les logiciels sont maintenant un patrimoine avec une valeur scientifique qui sera de plus en plus importante donc il faut les référencer.

La solution à ce problème est d'établir des procédures dans le laboratoire pour référencer tous les logiciels développés. Des procédures différentes sont possibles et chaque laboratoire doit décider en conseil de laboratoire la procédure qui s'adapte le mieux à sa situation, ses habitudes. Ce document propose un peu plus bas, deux procédures possibles pour servir d'exemple.

Les droits patrimoniaux

Ces procédures doivent respecter les détenteurs des droits patrimoniaux d'un logiciel. En effet, la plupart des logiciels d'un laboratoire sont développés, à un moment ou autre, dans un cadre de travail salarié, et les droits patrimoniaux reviennent aux employeurs des développeurs. Ces employeurs sont en général les tutelles du laboratoire.
Qu'arrive-t-il quand il y a plusieurs tutelles au laboratoire ? Comment gère-t-on la ligne copyright qui indique les détenteurs des droits patrimoniaux et qui apparaît dans l'en-tête de tout fichier du code source ?
Il arrive aussi que des étudiants ou stagiaires avec des financements extérieurs à l'établissement participent aux développements logiciels. Ils sont détenteurs, au même titre que l'établissement, des droits patrimoniaux.
Pour l'ensemble de ces questions, qui ne sont pas l'objet de cet article, on se référera au document Fiche Plume Licence & copyright pour les développements de logiciels libres de laboratoires de recherche.

Le projet RELIER

Le projet RELIER, sous-ensemble du projet PLUME, vise à REférencer les développements Logiciels Internes de l'Enseignement supérieur et de la Recherche. Ce projet permet à chaque membre de laboratoire (développeur...) de rédiger des descriptifs des logiciels produits dans le laboratoire sur la plate-forme PLUME qui sont ensuite publiés sous forme de fiches (appelées fiches Dév ESR) avec des mots clés pour la recherche. Cette plate-forme permet aussi de présenter la liste des logiciels produits par chaque laboratoire (voir par exemple http://www.projet-plume.org/fr/IGM-Labinfo/) et chaque tutelle. Cette plate-forme est donc un outil très intéressant et gratuit qui permet au laboratoire de faire un inventaire de ses logiciels et de les faire connaître donc les valoriser.

Une première procédure proposée

Cette procédure contient quatre étapes.
Mais avant, il faut identifier certains développements logiciel qui nécessitent des conseils des experts 'droits patrimoniaux, licences, valorisation...' et leurs appliquer le rappel ci-dessous.

Rappel : travaillez avec les services de valorisation.

Avant toute diffusion, avant toute collaboration, contacter le SAIC de l'université et/ou des services de valorisation des tutelles (cf annuaire des services SPV du CNRS) s'il y a développement de logiciels dans :

  • Une réponse à un appel à projets.
  • Un contrat.
  • Une participation au développement de personnes dont le financement est extérieur à l'établissement.
  • Un dépôt à l'Agence de Protection des Programmes.
  • Une rédaction de brevet.
  • Une recherche de partenaires industriels.
  • Une diffusion d'un logiciel sous licence propriétaire.

 

Étape 1 : Identification du logiciel à référencer (référence RELIER - fiche Dév ESR)

Une référence de logiciel doit pouvoir identifier le logiciel tout au long de sa vie, en tenant compte de ses possibles évolutions. La référence RELIER (fiche Dév ESR) comporte les champs suivants :

  • nom,
  • auteur(s),
  • propriétaires des droits patrimoniaux (tutelles et autres),
  • licence(s) (voir note),
  • version,
  • date,
  • mots clés,
  • fonctionnalités,
  • contexte d'utilisation,
  • publications liées au logiciel.

Note : Tout logiciel diffusé doit être sous licence, libre ou propriétaire.

Étape 2 : Notification des logiciels de recherche à la direction du laboratoire

La direction du laboratoire doit être notifiée du souhait de référencement de chaque logiciel de recherche (ainsi que de la licence choisie pour la diffusion). Cela comprend tous les logiciels en production au laboratoire. La publication des références de logiciels soumis à des clauses de confidentialité dans des contrats est à étudier.

Étape 3 : Notification aux tutelles et demande d'accord des détenteurs des droits patrimoniaux.

Cette étape concerne principalement les logiciels libres : avant sa diffusion et recensement, la ligne copyright, contenant les détenteurs des droits patrimoniaux  et qui est insérée dans le code du logiciel doit être établie. Plus d'informations sur le copyright sont données dans le document Fiche Plume Licence & copyright pour les développements de logiciels libres de laboratoires de recherche. La procédure proposée est que la direction du laboratoire adresse (par message électronique) aux tutelles une demande de validation de la mise en ligne du logiciel libre, avec une proposition de ligne copyright. Si elle n'obtient pas de réponse au bout de 30 jours, la direction du laboratoire considère sa demande de diffusion de logiciel libre et sa ligne copyright comme validée par les tutelles. Ce délai de réponse de 30 jours n'a pas été validé officiellement mais il nous parait raisonnable.
La situation courante actuelle est que les développeurs diffusent en libre sans forcément en référer aux tutelles, il faut que ceci évolue comme le propose cette procédure.

Pour les logiciels propriétaires qui font l'objet d'un contrat, la ligne copyright doit être définie dans le contrat.

Étape 4 : Saisie de la référence RELIER (fiche dév ESR de PLUME) et publication

La ligne copyright est insérée dans le code, la licence est établie pour le code source et/ou le code binaire du logiciel.
Un membre du laboratoire peut alors saisir la description du logiciel sur le serveur PLUME. Cela se fait en ligne, il faut d'abord devenir membre PLUME puis proposer une fiche et après acceptation saisir la fiche. Après relecture, la référence est publiée. Sur le serveur PLUME, ce nouveau logiciel est ajouté à la liste officielle des logiciels du laboratoire.

Sur cette première procédure

Cette procédure a été conçue pour respecter les détenteurs des droits patrimoniaux de chaque logiciel, et leur accorder un délai raisonnable pour la vérification des engagements des tiers ou contractuels que ces logiciels peuvent entraîner.
Par contre elle peut s'avérer inadéquate dans certaines occasions qui requièrent une diffusion rapide d'un logiciel sous licence libre. Par exemple une soumission d'article pour une conférence : pour valider les résultats de recherche de l'article il est souhaitable d'avoir un accès au logiciel, or une licence doit être mise en place avant toute diffusion d'un logiciel.
Cette procédure peut aussi s'avérer trop contraignante pour des chercheurs qui n'ont jamais reçu d'instruction sur cette question et qui ont toujours agi selon leur propre volonté.
Pour ces raisons nous proposons une deuxième procédure quand une clause spécifique a été ajoutée dans le contrat quadriennal.

Une deuxième procédure proposée

Cette procédure est envisageable si la ligne copyright d'un logiciel libre a été clairement définie lors de la signature du contrat quadriennal entre les établissements tutelles du laboratoire. En effet, lors de cette signature les tutelles arrêtent un accord sur la signature des articles de recherche, nous proposons que la ligne copyright des logiciels libres soit aussi discutée et définie, tout en respectant les détenteurs des droits patrimoniaux.
Il y a aussi, de même que pour les publications de recherche, une délégation implicite aux développeurs de la responsabilité des engagements (contrats, absence de contrefaçon...) concernant le logiciel.

Dans ce cas, les étapes rappel, 1 et 2 sont les mêmes que dans la procédure précédente, mais les deux dernières étapes sont interverties.

Étape 3 : Saisie de la référence RELIER (fiche Dév ESR) et publication

La ligne copyright est insérée, la licence est établie pour le code source et/ou le code binaire du logiciel. Le logiciel  est distribué sous licence libre. Le logiciel est décrit dans PLUME et la référence RELIER (fiche Dév ESR) est publiée. Un nouveau logiciel est ajouté à la liste officielle des logiciels du laboratoire.

Étape 4 : Notification aux tutelles.

La direction du laboratoire adresse aux tutelles (par message électronique) la notification de la mise à jour de sa liste officielle des logiciels.

Le parallèle entre publications et logiciels d'un laboratoire

En résumé on propose que la liste de logiciels d'un laboratoire de recherche soit produite et gérée de la même façon que celle de ses publications, c'est essentiel pour la connaissance et la pérennisation du patrimoine scientifique.
Pour la production de la bibliographie, les laboratoires peuvent utiliser le serveur HAL ; ils peuvent utiliser la plate-forme PLUME/RELIER pour le référencement des logiciels. Un lien depuis le Web du laboratoire vers la page laboratoire dans PLUME (ou la récupération d'un flux RSS de PLUME vers le Web du laboratoire) permet aussi d'accéder à ce référencement dans le Web du laboratoire et d'avoir une visibilité laboratoire.
De la même façon que la signature des publications est définie lors de la négociation des contrats quadriennaux des établissements, la ligne copyright pour identifier les détenteurs des droits patrimoniaux des logiciels libres peut être établie ; ceci facilite ensuite la diffusion rapide des logiciels libres des laboratoires.
Les publications de recherche sont souvent soumises à des procédures de validation (soumission et acceptation d'une publication) des résultats qui y sont publiés. Les logiciels n'ont pas ce type de procédure mais les publications associées à ces logiciels sont un élément pour leur validation. Et dans le cas des logiciels libres, la communauté d'utilisateurs qui accompagne habituellement ces logiciels renforce le processus de validation. Ces deux informations sont données dans les fiches PLUME-RELIER. Pour les logiciels propriétaires leur validation passe par les contrats qu'ils attirent.
La liste de publications d'un laboratoire permet son évaluation mais aussi la diffusion d'un savoir-faire qui alimente la recherche et contribue à son évolution permanente. De la même façon, la diffusion de la liste de logiciels d'un laboratoire peut conduire à leur incorporation comme brique logicielle dans d'autres développements, les laboratoires et les organismes de recherche doivent garantir les meilleures conditions pour ce processus de rayonnement.

Un correspondant logiciel dans le laboratoire ?

Chaque développeur peut suivre une des procédures proposées ci-dessus. Mais lorsque la production de logiciels est importante dans un laboratoire, la direction peut désigner une personne qui coordonne et éventuellement fasse le travail de saisie des descriptifs dans PLUME... En centralisant ce travail, cela permet d'homogénéiser l'ensemble des présentations, de gagner du temps et d'avoir une personne avec une vue d'ensemble de toutes les productions logicielles. C'est ce qu'a fait mon laboratoire en me désignant : cela a beaucoup facilité le référencement.
Le terme 'correspondant logiciel' s'inspire de celui de 'correspondant formation' utilisé au CNRS entre autres. En effet, un réseau de correspondants logiciels nous semble souhaitable et permettra la mise en place d'une vraie politique de valorisation de logiciels.

Si vous désirez mettre en place ce type de procédure et avez besoin de conseils relier-pilote [at] services [dot] cnrs [dot] fr (Ecrire à Plume à l'équipe RELIER).

Commentaires

Présentation avec video

Ce document a été présenté lors d'une journée PLUME avec transparents et vidéo disponibles