Sujets de stages sur la LSF
Traitement automatique de la Langue des Signes Française
Animation de signeur virtuel
|
Responsable de l'équipe : Annelies Braffort
Téléphone : 01 69 85 80 68
Mél : annelies.braffort  limsi.fr
Laboratoire : LIMSI-CNRS
Adresse : Campus d'Orsay Bât 508, BP 133, 91403 ORSAY cedex
|
|
Contexte :
L'équipe "M&TALS" du LIMSI s'intéresse au Traitement Automatique de la Langue des Signes Française (LSF).
La langue des signes française (la langue des signes employée en France, ou LSF) est la langue naturelle des personnes sourdes en France. C'est une langue visuelle et gestuelle :
une personne s'exprime en LSF en utilisant de nombreuses composantes corporelles (les mains bien sûr, mais aussi les expressions du visage, le regard, le buste, etc.) et son interlocuteur perçoit le message par le canal visuel.
Le fonctionnement linguistique de la LSF est très différent de celui des langues vocales,
sa modélisation informatique nécessite de concevoir des représentations spécifiques.
Au sein de l'équipe, nous élaborons des corpus vidéos que nous annotons puis analysons. Nous en déduisons des représentations informatiques du lexique et des énoncés, que nous implémentons puis évaluons. L'équipe développe pour cela des plateformes de génération automatique et d'animation de signeur virtuel. Un signeur virtuel est un personnage 3d virtuel s'exprimant en LSF. Ainsi, les sujets de stages peuvent porter sur des aspects très variés allant de l'analyse de corpus à l'informatique graphique en passant par le traitement automatique des langues, le traitement du signal ou l'ergonomie.
Exemple d'application : cliquez
ICI
Nature des stages : Les stages sont de niveau master 1 ou 2 ou école d'ingénieur
Rémunération : conventions de stage, gratifications (environ 400 euros/mois)
2012-2013 : 3 stages master recherche
1. Annotation et analyse de corpus de LSF
Encadrant : Michael Filhol et Annelies Braffort
Mots clé : Linguistique de corpus, langue des signes française (LSF)
Objectif :
Les langues des signes sont des langues orales, gestuelles, et pour lesquelles les études linguistiques sont récentes et dont les grammaires demeurent très peu connues. Aussi, ces langues sont peu dotées, au sens où les corpus sont encore rares et doivent souvent être constitués par les chercheurs avant d'entreprendre une observation. À partir des corpus vidéo dont dispose l'équipe et d'un travail d'exploration, annotation et analyse, ce stage vise à découvrir et formaliser différents invariants dans les productions signées, et à établir les liens entre la fonction et la forme de ces invariants. Ainsi, le stage contribuera à construire une base de règles de production, utilisables ensuite en entrée d'un système de génération automatique d'énoncés signés par un signeur virtuel.
Selon la durée du stage et les aspirations du candidat, on pourra se concentrer sur une forme particulière (transfert situationnel ou "depicting sign"), un domaine sémantique particulier (expression du temps, des relations topologiques, des comparaisons, de l'opposition, des choix, de la cause...), ou explorer les niveaux supérieurs de construction de la langue comme les structures rhétoriques du discours.
Profil recherché :Sciences du langage, linguistique des langues des signes, TAL.
Connaissance de la LSF demandée.
2. Évaluation et amélioration d'un modèle de description de règles de production en langue des signes
Encadrant : Michael Filhol
Mots clé : Modélisation linguistique, langue des signes française (LSF)
Objectif :
Langues gestuelles, les langues des signes possèdent des grammaires différentes des grammaires classiques, valables avant tout pour le paradigme écrit. Une première raison est la simultanéité des articulateurs, propriété secondaire ou absente dans les grammaires traditionnelles. Une deuxième est qu'elles évoluent dans l'espace et mettent en œuvre des productions iconiques ainsi que des phénomènes de spatialisation, assignant des emplacements pertinents de l'espace à des entités du discours. C'est pourquoi l'équipe M&TALS a proposé un nouveau formalisme "AZee", dédié aux langues gestuelles et basé sur des contraintes spatio-temporelles entre les différents articulateurs de la LSF, pour mieux représenter ces propriétés de multi-linéarité et d'iconicité.
Le but du stage est de procéder à la description formelle en AZee d'un certain nombre de structures dans les productions observées, et d'en lister les limites en guise de première évaluation du modèle.
Profil recherché : Master en sciences du langage, linguistique informatique, TAL. Connaissance de la LSF demandée, même limitée.
3. Développement de modules d'annotation automatiques et/ou semi-automatiques de textes pour baliser des structures sémantiques
Encadrant : Michael Filhol + co-encadrant TAL
Mots clé : Traitement automatique de l'écrit, extraction d'informations sémantiques, traduction automatique
Objectif : L'équipe M&TALS s'intéresse à la problématique de traduction automatique du texte écrit vers la langue des signes en utilisant des scripts AZee, formalisme proposé par le LIMSI, comme pivot. Notre approche est basée sur l'étude d'un corpus parallèle de brèves journalistiques dans les deux langues : français (écrit) et LSF. Accueilli par une équipe de recherche en traitement automatique des langues des signes, ce stage vise à développer des modules d'annotation automatiques et/ou semi-automatiques de textes pour baliser des structures sémantiques. Le stagiaire s'intéressera à développer des scripts, plus ou moins complexes et en utilisant tous les outils à sa disposition, pour analyser les textes et annoter les structures écrites dont la sémantique est traduisible par une structure linguistique repérée en LSF. En fonction du temps imparti, le stagiaire s'attaquera à un certain nombre de structures systématiques employées dans les vidéos de LSF, prises dans une liste fournie au départ.
Profil recherché : Master en sciences du langage, linguistique informatique, TAL. Sans être obligatoire, toute connaissance de la LSF sera appréciée.
Mise à jour : 12/10/2012