Interdiction de parler au conducteur ?

Dialogue multimodal et reconnaissance de la parole dans la voiture en situation

Paul Heisterkamp, Entreprise Daimler-Chrysler, Speech Understanding (FT3/AV), Ulm

Séminaire CHM du LIMSI
13-12-99



une voiture n'est pas un dinosaure

En commençant par les conditions spécifiques de reconnaissance de la parole à l'intérieur d'une voiture, en particulier, par l'exemple du système Linguatronic, nous développerons notre exposé sur la technique du dialogue.

Nous distinguons entre les dialogues initiés par le conducteur d'une part, et ceux qui sont initiés par le système de dialogue d'autre part. Les premiers doivent répondre à un besoin spécifique du conducteur. On peut supposer que, dans ce cas, la conduite permet une interaction dialogique sans risque pour la sécurité routière. En revanche, le deuxième type de dialogues force la transmission d'une information. Cela ne peut être réalisé que si le système dispose de certaines informations sur l'état de conduite, lui permettant de porter un jugement sur l'attention du conducteur et sur sa capacité cognitive.

Nous montrons comment un système de dialogue peut s'adapter à une telle situation. Cette adaptation dépend des fonctionnalités du système et va du choix de l'énonciation, des formulations spécifiques, etc. jusqu'à l'utilisation de pseudo-personnalités.

Un accent particulier est mis sur les difficultés qui résultent d'une situation de conduite. Une telle situation développe un dynamisme qui exige l'interprétation cohérente des données provenant de différentes sources.

Nous concluons enfin que, pour déterminer si une application de dialogue en voiture est viable, il est nécessaire d'établir un bilan positif entre son utilité (dans quelle mesure l'application aide-t-elle le conducteur à compléter ses tâches mieux/plus vite/plus simplement ?) et son utilisabilité (quelles sont les capacités cognitives nécessaires ? Comment sont-elles mises en jeu ?) Les réponses à ces questions permettent de déduire les exigences vis-à-vis des technologies de base, telles que la fiabilité du module de reconnaissance, la couverture du lexique et de la grammaire, etc. Ces exigences doivent atteindre un niveau minimum pour qu'une nouvelle application se révèle un succès.