HDR TAL : Adaptation de documents techniques pour les locuteurs non specialisés

Natalia GRABAR, du laboratoire Savoirs, Textes, Langage de l'Université de Lille, soutient son HDR mardi 17 mai 2019 à 14:00 au LIMSI

Jury

  • Pascale Sébillot, Professeur, INSA de Rennes, Rennes, France (rapporteur)
  • Cédrick Fairon, Professeur, Université Catholique de Louvain, Louvain-La-Neuve, Belgique (rapporteur)
  • Pierrette Bouillon, Professeur, Université de Genève, Genève, Suisse (rapporteur)
  • Chantal Reynaud, Professeur, Université Paris-Sud, Orsay, France (examinateur)
  • Stefan Schulz, Professeur, Graz General Hospital and University Clinics, Graz, Autriche (examinateur)
  • Nabil Hathout, Directeur de Recherche CNRS, Toulouse, France (examinateur)
  • François Yvon, Professeur, Université Paris-Sud, CNRS, Orsay, France (garant)

Comme tout domaine de spécialité, le domaine médical manipule des notions très spécifiques (comme blépharospasme, alexitymie ou appendicectomie), qui sont difficiles à comprendre par les non-spécialistes. Nous proposons un ensemble de travaux dont l'objectif général consiste à adapter les documents techniques de santé et à en assurer une meilleure compréhension par les non-spécialistes. Pour atteindre cet objectif, nous proposons une série d'expériences qui se font partie d'un processus complexe et ambitieux :

(1) la catégorisation des documents selon la difficulté qu'ils présentent;

(2) la détection de passages difficiles au sein des documents;

(3) l'acquisition de ressources pour la simplification lexicale et sémantique des documents;

(4) l'alignement de phrases parallèles à partir de corpus comparables pour engendrer des règles de transformation syntaxique.

En plus, une partie non expérimentale du travail est dédiée à l'analyse des travaux de l'état de l'art autour de l'évaluation de la simplification de documents. De manière générale, la recherche que nous présentons ici est une recherche appliquée, motivée par des besoins réels. Chaque étape est effectuée avec une méthode clairement décrite et testée, dont les résultats sont évalués, positionnés par rapport à l'état de l'art et discutés. En fonction des étapes et des tâches, différentes méthodes sont exploitées (à base de règles, par apprentissage supervisé, avec ou sans les connaissances linguistiques...). À différentes étapes de ce travail, il a également été nécessaire de construire de nouvelles ressources (lexique, corpus...), dont la genèse est également retracée. En dehors de la simplification lexicale et de la compréhension de textes de spécialité, les résultats et ressources obtenus peuvent être utiles pour d'autres applications et tâches du traitement automatique des langues (comme recherche et extraction d'information, systèmes de questions-réponses, implication textuelle).

LIMSI
Campus universitaire bât 507
Rue du Belvedère
F - 91405 Orsay cedex
Tél +33 (0) 1 69 15 80 15
Email

RAPPORTS SCIENTIFIQUES

Rapport scientifique

 

Le LIMSI en chiffres

7 équipes de recherche
100 chercheurs et enseignants-chercheurs
40 ingénieurs et techniciens
60 doctorants
70 stagiaires

 

Paris-Saclay nouvelle fenêtre


Logo DataIA

 

© 2015 LIMSI CNRS