Développements récents en ingénierie
des états finis
Lauri Karttunen (Xerox Europe)
Séminaire CHM du LIMSI
13-10-98
Les transducteurs à états finis traitent efficacement de
nombreuses étapes de base du traitement
des langues, qu'il s'agisse de la lemmatisation,
de l'analyse morphologique, de la
désambiguïsation ou de la pré-analyse (shallow parsing).
Ces transducteurs sont compilés à partir
d'expressions régulières, c'est-à-dire, d'un langage
formel décrivant des ensembles et des relations.
Ces expressions régulières et la compilation
d'automates à partir d'elles font, depuis plusieurs
décennies, partie de l'informatique
élémentaire. Mais le langage en question
a récemment été enrichi de nombreux
opérateurs et
constructions, qui simplifient la construction de
transducteurs complexes pour le traitement des
langues.
L'exposé portera sur certains d'entre
les opérateurs (restriction, remplacement, union prioritaire
et composition indulgente) et donnera quelques exemples de leur application.