La vision par machine est étudiée selon deux orientations principales : d'une part, en tant que mode de communication, ce qui implique de concevoir des outils de perception visuelle qui améliorent l'interaction homme-machine par l'introduction de nouveaux media ; d'autre part, en tant qu'outil d'aide pour assister l'utilisateur dans la réalisation d'une tâche particulière.
En tant que mode de communication, un outil de perception visuelle doit permettre à un utilisateur d'interagir naturellement et spontanément avec une machine. Les machines actuelles rendent possible l'intégration de ces outils qui nécessitent pourtant des calculs lourds. De plus, ces machines sont souvent équipées de dispositifs d'acquisition vidéo. Néanmoins, Cette intégration nécessite le développement de systèmes non intrusifs capables d'interpréter en temps réel des informations visuelles émises par l'utilisateur.
L'étude la vision par machine concerne l'exploitation de la modalité visuelle pour capter et traiter des informations sur l'environnement de l'interaction ou sur l'interaction elle-même. Deux projets sont mis en œuvre : un système de capture et de suivi du regard (cf. page de présentation ``CapRe'') et fait l'objet d'un travail de thèse en collaboration avec le LSV-CNRS (A. Finkel, ENS Cachan) ; un système de reconnaissance de gestes (cf. page de présentation ``PoG'') dans le cadre du projet Européen ESPRIT Open LTR ``Chameleon'', en collaboration avec la société BERTIN (France) et le CPK (Danemark). Ce projet se fait en collaboration avec le thème 3.
En tant qu'outil d'aide, un système de vision permet notamment de réaliser des tâches de capture d'objets réels. Nous concevons des outils interactifs permettant à un utilisateur d'extraire certaines informations sur ces objets (forme, couleur, relief, etc.) en vue de les représenter et de les manipuler. Deux types de tâches sont considérées : reconstruction 3d d'objets et interprétation de documents.
Pour la reconstruction 3d, une première démarche vise à donner une capacité de perception aux systèmes de CAO. Il s'agit de la réalisation d'outils d'acquisition d'objets réels (extraction et appariement de chaînes de contours, analyse photométrique, etc.) pour le projet ROSA (cf. page de présentation ``ROSA''). Une deuxième démarche traite plus particulièrement des images médicales pour la reconstruction d'organes à partir de coupes scanner parallèles (cf. page de présentation ``PTM3D''). Ces deux démarches (en collaboration avec le thème 2) font appel à l'extraction de primitives visuelles qui conduit à une reconstruction peu dense. Une troisième démarche vise à déterminer une carte de profondeur dense d'une scène réelle avec une approche basée sur la programmation dynamique (cf. page de présentation ``VIP'') en collaboration avec le département Mécanique Energétique.
Pour l'interprétation de documents, les travaux concernent d'une part l'indexation automatique de documents vidéo (cf. page de présentation ``Indexation'') en collaboration avec le groupe TLP ; d'autre part la modélisation de la lecture, la reconnaissance d'écriture manuscrite par des méthodes connexionnistes et l'identification de codes barre bidimensionnels.