"Analyse automatique des langues naturelles avec INTEX : de l'alphabet à la syntaxe"
INTEX
( Max Silberztein, Université de Besançon)

Séminaire CHM du LIMSI
2-2-99

INTEX est un environnement de développement linguistique qui est fondé sur la technologie des transducteurs à états finis. INTEX contient des dictionnaires à large couverture, de nombreuses grammaires à états finis, et peut appliquer ces descriptions linguistiques sur des textes de taille importante en temps réel. Une caractéristique importante d'INTEX est que les textes, les dictionnaires et les grammaires sont tous trois représentés par des transducteurs ; donc toutes les fonctionnalités d'INTEX se ramènent à un nombre très faible (< 30) d'opérations élémentaires sur les transducteurs. Par exemple, étiqueter un texte revient à appliquer l'union des transducteurs des dictionnaires sur le transducteur du texte, puis à calculer l'intersection entre le transducteur du texte et l'union des grammaires locales de levée d'ambiguïtés. L'intervenant effectuera une démonstration du logiciel en partant d'un texte "brut" ASCII.