Atlas sémantique

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 01/07/11
  • Correction mineure : 01/07/11
Mots-clés

Atlas sémantique : modélisation en sémantique lexicale

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Licence(s) : Licence propriétaire - Par le biais du site http://dico.isc.cnrs.fr, une utilisation raisonnable du logiciel (moins de 500 requêtes par jour) est proposée gratuitement.
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Sabine Ploux et Hyungsuk Ji
  • Contact concepteur(s) : sploux@isc.cnrs.fr
  • Laboratoire(s), service(s)... : L2C2

 

Fonctionnalités générales du logiciel

Les Atlas sémantiques (AS) (nom déposé en 2001 auprès de l'UE) sont un modèle géométrique de représentation du sens lexical disponible pour le français, l'anglais, l'espagnol et le portugais (en cours). C'est également un modèle d'appariement entre langues. Par rapport à d’autres paradigmes classiques : modélisation hiérarchique (WordNet) ou analyse sémantique latente (LSA), le modèle géométrique est le seul à offrir l’avantage d’un appariement sémantique multilingue totalement automatisé. Cet appariement s’adapte à la structure sémantique propre à chaque langue, il est indépendant d’une organisation des concepts pré-établie par des experts.

Différentes fonctions sont disponibles dans ce paradigme :

  1. (1) la représentation du sens des mots à partir de synonymes;
  2. (2) la classification hiérarchique des différents sens ;
  3. (3) l’appariement sémantique entre deux langues ;
  4. (4) l’analyse du sens des mots par les liens de co-occurrence : il s’agit du modèle ACOM ;
  5. (5) l’analyse du sens des locutions.
Contexte d’utilisation du logiciel

Auprès du public : ce modèle a montré son utilité auprès du public. Le site des Atlas sémantiques reçoit un nombre très important de requêtes venant du monde entier, c'est l'un des sites les plus consultés du domaine cnrs.fr (source Alexa.com).

Auprès de la communauté scientifique : les bases de données lexicales ont été déposées à l'APP et sont disponibles pour la communauté scientifique. Différents laboratoires les utilisent dans le cadre de recherche portant sur la linguistique computationnelle, le traitement automatique des langues ou en psycholinguistique expérimentale.

Publications liées au logiciel

http://dico.isc.cnrs.fr

Sabine Ploux. (1997) Modélisation et traitement informatique de la synonymie. /Linguisticae Investigationes/. XXI:1.

Sabine Ploux and B.Victorri. (1998) Construction d’espaces sémantiques à l’aide de dictionnaires informatisés des synonymes. /TAL/. 39 :1.

Sabine Ploux and Hyungsuk Ji. (2003). A Model for Matching Semantic Maps Between Languages ( French / English, English / French ). /Computational Linguistics/. 29(2):155-178.

Hyungsuk Ji, Sabine Ploux and Eric Wehrli. (2003) Lexical Knowledge Representation with Contexonyms. In /Proceedings of the 9th MT summit/. 194-201.

Sabine Ploux (inédit, disponible sur le site des AS) La représentation de la sémantique des phrases dans le paradigme géométrique des Atlas sémantiques : Une étude sur les syntagmes de type V-N et N-ADJ.

Sabine Ploux (2007). Enrichir automatiquement des dictionnaires de synonymes et de traduction : une application du modèle géométrique des Atlas sémantiques. Dans les actes des /7èmes journées scientifiques du réseau Lexicologie, Terminologie, Traduction (LTT)/, Tunis.

Ji, H., Lemaire, B., Choo, H., Ploux, S. (2008) Testing the cognitive relevance of a geometric model on a word-association task: A comparison of humans, ACOM, and LSA. /Behavior Research Methods/ 40(4), 926-934.