"Analyse automatique des langues naturelles avec INTEX : de
l'alphabet à la syntaxe"
(
Max Silberztein, Université de Besançon)
Séminaire CHM du LIMSI
2-2-99
INTEX est un environnement de développement linguistique qui est fondé sur la technologie des
transducteurs à états finis. INTEX contient des dictionnaires à large couverture, de nombreuses
grammaires à états finis, et peut appliquer ces descriptions linguistiques sur des textes de taille
importante en temps réel. Une caractéristique importante d'INTEX est que les textes, les
dictionnaires et les grammaires sont tous trois représentés par des transducteurs ; donc toutes les
fonctionnalités d'INTEX se ramènent à un nombre très faible (< 30) d'opérations élémentaires
sur les transducteurs.
Par exemple, étiqueter un texte revient à appliquer l'union des transducteurs des dictionnaires sur
le transducteur du texte, puis à calculer l'intersection entre le transducteur du texte et l'union des
grammaires locales de levée d'ambiguïtés. L'intervenant effectuera une démonstration du
logiciel en partant d'un texte "brut" ASCII.