Interdiction de parler au conducteur ?
Dialogue multimodal et reconnaissance de la parole dans la voiture en situation
Paul Heisterkamp, Entreprise Daimler-Chrysler, Speech Understanding (FT3/AV), Ulm
Séminaire CHM du LIMSI
13-12-99
En commençant par les
conditions spécifiques de reconnaissance de la parole à
l'intérieur
d'une voiture, en particulier, par l'exemple du
système Linguatronic, nous développerons notre exposé
sur
la technique du dialogue.
Nous distinguons entre les dialogues
initiés par le conducteur d'une part, et ceux qui sont initiés
par le système de dialogue d'autre part. Les premiers
doivent répondre à un besoin spécifique du conducteur.
On peut supposer que, dans ce cas, la conduite permet une interaction dialogique
sans risque pour la sécurité routière.
En revanche, le deuxième type de dialogues force la
transmission d'une information. Cela ne peut être
réalisé que si le système dispose de certaines
informations sur l'état de conduite, lui permettant de porter un jugement
sur l'attention du conducteur et sur sa capacité cognitive.
Nous montrons
comment un système de dialogue peut s'adapter à une telle
situation. Cette adaptation dépend des fonctionnalités
du système et va du choix de l'énonciation, des formulations
spécifiques, etc.
jusqu'à l'utilisation de pseudo-personnalités.
Un accent particulier est
mis sur les difficultés qui résultent d'une situation de conduite.
Une telle situation développe un dynamisme qui exige l'interprétation
cohérente des données provenant de différentes sources.
Nous concluons enfin que, pour déterminer si une application de dialogue
en voiture est viable, il est nécessaire d'établir un bilan
positif entre son utilité (dans quelle mesure l'application aide-t-elle
le conducteur
à compléter ses tâches mieux/plus vite/plus simplement ?)
et son utilisabilité (quelles sont les capacités cognitives
nécessaires ? Comment sont-elles mises en jeu ?) Les réponses
à ces questions permettent de déduire les exigences vis-à-vis
des technologies de base, telles que la fiabilité du module de reconnaissance,
la couverture du lexique et de la grammaire, etc. Ces exigences doivent atteindre
un niveau minimum pour qu'une nouvelle application se révèle
un succès.