De la variation dans la production et la perception de la parole: analyses linguistiques de grand corpus en lien avec le traitement automatique

HDR de Ioana Vasilescu, équipe TLP, jeudi 24 novembre 2016 au Limsi

La parole continue est un phénomène hautement variable. Des facteurs tels que les locuteurs et leurs caractéristiques physiologiques, les contextes communicationnels ou encore les conditions d'enregistrement concourent à sa variabilité. Cette dernière décennie a vu se développer une méthodologie conjuguant traitement automatique et analyse acoustico-prosodique des marques de la variation linguistique dans de grands corpus oraux. Dans ce cadre méthodologique, les erreurs produites par les systèmes automatiques de traitement pour la communication parlée représentent un nouveau type de corpus renseignant sur certaines ambiguïtés dans la langue, témoins potentiels d'une variation régulière insuffisamment renseignée. Les travaux que je présente en vue de l'obtention de l'habilitation à diriger des recherches ont été pour la plupart menés au LIMSI et ont eu comme point de départ l'observation des erreurs de traitement de différents systèmes automatiques, dédiés à l'identification des langues, la transcription de la parole, la catégorisation des émotions ou encore le dialogue humain-machine. J'ai développé une approche qui utilise les erreurs comme point de départ pour des analyses acoustico-prosodiques sur la variation à l'oral et pour des expérimentations psycholinguistiques dédiées à la comparaison humain vs système automatique dans le traitement de l'information verbale. Pour ce qui est de la production de la parole, les résultats indiquent des patrons intra et inter-langues de la variation au niveau non-lexical (disfluences) et lexical (réalisations acoustiques et contrastes phonémiques, interface phonétique vs phono-morphologie). En perception, des tests perceptifs basés sur des échantillons variés de parole spontanée renseignent sur l'écart humain vs système automatique dans différentes configurations expérimentales et sur les stratégies mises en œuvre par les auditeurs pour surmonter l’ambiguïté locale. Ces études ouvrent des pistes nouvelles pour les études (psycho)linguistiques de grand corpus à travers l’exploitation des systèmes automatiques non seulement comme des instruments de pré-traitement des corpus, mais comme des outils linguistiques à part entière, permettant d'explorer des aspects systémiques.

Jury

- Martine Adda-Decker, Directeur de Recherche, Université Paris 3
- Régine André-Obrecht, Professeur, Université Paul Sabatier
- Lori Lamel, Directeur de Recherche, Limsi CNRS
- Mark Liberman, Professeur, University of Pennsylvania
- Catherine Pelachaud, Directeur de Recherche, ISIR, Université Paris Sorbonne
- Dan Tufis, Professeur, Académie Roumaine

Publications

Articles

Communication avec acte

Chapitres dans des ouvrages