Unitex
Ce système permet de construire des ressources linguistiques telles que des dictionnaires électroniques et des grammaires et de les utiliser pour effectuer des recherches complexes dans des textes et de construire des concordances.
- Traitement de l'ambiguïté lexicale par automates
- Utilisation de tables de lexique-grammaire
Tous les formats utilisés sont décrits en détails dans le manuel d'utilisation.
Unitex est utilisé au laboratoire LIGM pour la construction et la maintenance de ressources linguistiques (dictionnaires et grammaires).
Il permet également d'exploiter ces ressources en les appliquant sur des textes, ce qui autorise la recherche d'expressions complexes et la construction de concordanciers.
Cet aspect du système est à la base de nombreuses applications, dont les plus importantes sont le repérage de séquences (par exemple, entités nommées), l'extraction d'informations, le filtrage et le routage de documents, etc.
Il est au centre du projet Infomagic : http://fr.wikipedia.org/wiki/Infomagic
Les versions ultérieures à la version 1.2 requièrent Java 1.6.