Unitex

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 27/01/09
  • Correction mineure : 10/07/13
Mots-clés

Unitex : traitement de corpus utilisant des technologies à états finis

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 3.0 stable - septembre 2012
  • Licence(s) : LGPL - Les ressources linguistiques distribuées avec le logiciel sont sous licence LGPLLR, une licence développée par l’Université Paris-Est Marne-la-Vallée et validée par la FSF comme l’équivalent de LGPL pour des données linguistiques. http://igm.univ-mlv.fr/~unitex/lgpllr.html
  • Etat : validé (au sens PLUME), diffusé, stable, en développement
  • Support : maintenu, développement en cours
  • Concepteur(s) : Sébastien Paumier
  • Contact concepteur(s) : unitex@univ-mlv.fr
  • Laboratoire(s), service(s)... : LIGM

 

Une fiche logiciel décrit plus en détail ce développement, consultez la pour plus d’informations : Unitex
Fonctionnalités générales du logiciel

Le système Unitex permet de construire des ressources linguistiques telles que des dictionnaires électroniques et des grammaires, de les utiliser pour effectuer des recherches complexes dans des textes et de construire des concordances.

La fiche de logiciel validé indiquée dans le pavé supérieur décrit en détail le logiciel.

Contexte d’utilisation du logiciel

Outil d’exploration pour les recherches de l’équipe de informatique linguistique du laboratoire d'informatique.
Il est aussi utilisé dans plusieurs universités au niveau international, comme outil de recherche et d'enseignement dans l'informatique linguistique.

Publications liées au logiciel
  • Sébastien Paumier. 2000. Nouvelles méthodes pour la recherche d'expressions dans de grands corpus. In A. Dister (ed.), Actes des 3èmes Journées INTEX. Revue Informatique et Statistique dans les Sciences Humaines, 36ème année, n° 1 à 4.
  • Sébastien Paumier. 2003. A Time-Efficient Token Representation for Parsers, Proceedings of the EACL Workshop on Finite-State Methods in Natural Language Processing, Budapest, pp. 83-90.
  • D'autres publications associées au projet se trouvent dans son site web.