Acquérir des connaissances et analyser des textes pour l’accès à l’information

HDR de Olivier Ferret, CEA, mercredi 6 janvier 2016 à 14h, au LIMSI.

Le travail présenté défend l'idée que les exigences posées par les processus d'accès à l'information rendent nécessaire leur articulation étroite avec les processus d'analyse textuelle et d'acquisition de connaissances. Nous illustrons cette optique en présentant dans un premier temps un ensemble de travaux concernant pour une part, l'analyse discursive dans ses dimensions thématiques et événementielles et pour une autre part, l'acquisition de connaissances sémantiques à partir de textes, couvrant à la fois l'induction de sens de mots, la construction et l'amélioration de thésaurus distributionnels ainsi que la caractérisation de leurs relations.

Nous montrons dans un second temps comment les processus d'analyse et les ressources ainsi élaborés contribuent à mettre en œuvre et à améliorer des processus de résumé automatique, à la fois mono et multi-document, de question-réponse, en domaine ouvert et en domaine de spécialité, et d'extraction d'information, allant de l'extraction d'information supervisée focalisée sur les événements à l'extraction non supervisée de relations (Open Information Extraction) en passant par des approches semi-supervisées de type supervision distante.

Jury

Béatrice Daille, Université de Nantes, LINA (rapporteur)

Brigitte Grau, ENSIIE, LIMSI

Gregory Grefenstette, INRIA Saclay

Joseph Mariani, LIMSI

Marie-Francine Moens, Katholieke Universiteit Leuven (rapporteur)

Philippe Muller, Université Paul Sabatier, IRIT (rapporteur)

Pascale Sébillot, INSA de Rennes, IRISA