Actualités

Création de chronologies d'événements médicaux: extraction d'informations temporelles et résolution de la coréférence dans les dossiers patients électroniques

Thèse de Julien TOURILLE, sous la direction de Xavier Tannier et Aurélie Névéol, soutenue le 18/12/2018 à 14:00

Jury

Philippe Muller (Rapporteur) - Université Paul Sabatier (IRIT)
Mathieu Roche (Rapporteur) - CIRAD (TETIS)
Sandra Bringay (Examinatrice) - Université de Montpellier 3 (LIRMM)
Claire Nédellec (Examinatrice) - INRA (MaIAGE)
Guergana Savova (Examinatrice) - Harvard Medical School and Boston Children's Hospital Informatics
Xavier Tannier (Directeur de thèse) - Sorbonne Université (LIMICS)
Olivier Ferret (Co-encadrant) - CEA (LIST)
Aurélie Névéol (Co-encadrante) - CNRS (LIMSI)

Résumé

Les dossiers patients électroniques contiennent des informations importantes pour la santé publique. Être en mesure d’extraire automatiquement ces informations permettrait d’améliorer les soins médicaux et de soutenir la recherche clinique. Cependant, la majeure partie de ces informations est contenue dans des documents rédigés en langue naturelle.

Parmi toutes les informations cliniques intéressantes présentes dans ces dossiers, la chronologie médicale du patient est l’une des plus importantes. Être capable d’extraire  automatiquement cette chronologie permettrait d’acquérir une meilleure connaissance de certains phénomènes cliniques tels que la progression des maladies et les effets à long-terme des médicaments. De plus, cela permettrait d’améliorer la qualité des systèmes de question–réponse et de prédiction de résultats cliniques. Par ailleurs, accéder aux  chronologies médicales est nécessaire pour évaluer la qualité du parcours de soins en le comparant aux recommandations officielles et pour mettre en lumière les étapes de ce  parcours auxquelles une attention particulière doit être portée. Dans notre thèse, nous nous concentrons sur la création de ces chronologies médicales en abordant deux questions  connexes en Traitement Automatique des Langues (TAL): l’extraction d’informations temporelles et la résolution de la coréférence dans des documents cliniques.

Dans ce travail, nous présentons plusieurs contributions. Nous concevons une approche à base de traits pour l’extraction des relations temporelles. Nous évaluons notre approche sur un corpus de documents écrits en anglais. Ensuite, nous effectuons une évaluation empirique sur deux corpus de documents rédigés en anglais et en français et nous montrons qu’une approche similaire peut être utilisée pour les deux langues.

Notre seconde contribution consiste en une approche neuronale hybride pour l’extraction d’informations temporelles qui incorpore des traits catégoriels. Nous effectuons une étude empirique sur la façon dont ces traits affectent la performance de notre approche. Ensuite, nous évaluons notre approche sur un corpus de documents écrits en anglais.

En ce qui concerne la résolution de la coréférence, nous concevons une approche neuronale inspirée par les travaux récents dans le domaine général. Nous concevons un trait temporel et évaluons sa contribution dans le cadre d’une étude empirique visant à mesurer l’impact des traits catégoriels et des différents composants habituellement utilisés dans les approches neuronales tels que les mécanismes d’attention et les représentations au niveau des caractères.

En plus des contributions susmentionnées, nous proposons deux ressources à destination de la communauté TAL. Premièrement, nous convertissons le corpus i2b2 task1c au format CoNLL. Cette transformation pourrait favoriser la recherche sur la résolution de la coréférence dans le domaine clinique en permettant une meilleure reproduction des résultats et en facilitant l’utilisation du corpus. Deuxièmement, nous empaquetons notre module d’étiquetage de séquences dans un outil open-source appelé YASET qui peut être utilisé dans des tâche d’étiquetage de séquences en TAL.

LIMSI
Campus universitaire bât 507
Rue du Belvedère
F - 91405 Orsay cedex
Tél +33 (0) 1 69 15 80 15
Email

RAPPORTS SCIENTIFIQUES

Rapport scientifique

 

Le LIMSI en chiffres

8 équipes de recherche
100 chercheurs et enseignants-chercheurs
40 ingénieurs et techniciens
60 doctorants
70 stagiaires

 Université Paris-Sud nouvelle fenêtre

 

Paris-Saclay nouvelle fenêtre


© 2017 LIMSI CNRS