L I M S I - C N R S

Séminaire CHM

Laboratoire
CNRS
LIMSI
Séminaire CHM


Programmes précédents


Anné 01-02
Année 00-01
Année 99-00
Année 98-99
Année 97-98

VENISE




Autres
Séminaires


Talana
RISC

Groupes de Travail

REVERIES


Zen, une boîte à outils pour la représentation de bases de données lexicales, et les calculs phonologiques et morphologiques en traitement de la langue

Gérard Huet
Académie des Sciences
INRIA

Séminaire CHM du Mardi 16 Mars 2004

Résumé

Nous avons développé une boîte à outils "Zen" qui permet d'effectuer divers traitements en linguistique computationnelle, dans les couches de la structure linéaire - traitement phonologique, génération morphologique, segmentation et étiquetage.

Cette bibliothèque, qui utilise le langage fonctionnel Pidgin ML, est disponible comme logiciel libre en licence GPL sur le site http://pauillac.inria.fr/~huet/ZEN.

Les principes de base de Zen reposent sur la technologie AuM de représentation applicative de transducteurs d'état fini, la structure de données des zippers pour représenter une structure à un point de focus, le foncteur de partage, et les mots différentiels - ces notions seront expliquées.

Une démonstration de segmentation du sanskrit montrera une application typique de cette technologie.


Contacts :Patrick Paroubek & William Turner
Dernière mise à jour : 03 Décembre 2002