Thèmes de recherche
Corpus et représentation
Nous étudions des collections de documents (corpus écrits d'origine diverses, transcriptions d'oral, corpus vidéo de signeurs en LSF) dans le but de les analyser automatiquement, d'aider leur production ou de les créer automatiquement. Mais notre objet d'étude inclut aussi les ressources linguistiques, représentations de l'activité langagière humaine qui émergent de l'étude de ces corpus, comme les lexiques, les grammaires, les réseaux sémantiques et les bases d'information linguistiques.
Extraction et reconnaissance d'informations précises
L'extraction d'informations cherche à reconnaître, dans une collection de textes, des éléments d'information de types prédéfinis. Il s'agit par exemple des noms de personnes, de lieux ou d'organisations (les « entités nommées ») dans des articles de presse, ou encore des maladies, examens et traitements dans des comptes rendus médicaux. Il s'agit aussi des relations qu'entretiennent ces entités : qui a fait quoi quand où (par exemple, relations générales comme acteur ou cause d'un événement, ou spécifiques comme traitement d'une maladie). L'extraction d'informations peut être conçue comme une tâche en soi ou générer des informations qui servent de base à d'autres tâches comme la recherche d'informations précises.
Ce thème regroupe les activités de recherche portant sur la langue des signes (LS), selon trois aspects complémentaires : les corpus, la modélisation et la génération.
Multilinguisme
Le groupe ILES mène des travaux dans le domaine du multilinguisme et de la variation monolingue. Sa contribution dans le domaine du multilinguisme a notamment porté sur l'intégration de connaissances linguistiques en traduction automatique statistique, pour une meilleure prise en compte du contexte, une intégration efficace d'hypothèses de traduction provenant de différentes sources, ainsi qu'une évaluation automatique contrastive jouant un rôle complémentaire relativement aux métriques automatiques usuelles. Ces travaux sont menés en collaboration avec des membres du groupe TLP.