Action transversale VENISE
Virtualité et ENvironnement Immersif
pour la Simulation et l'Expérimentation
LIMSI-CNRS, Université Paris-Sud, Bât. 508, B.P. 133, 91403 Orsay cedex
(France).

Réalité
Virtuelle et Bioinformatique
(voir aussi projet ANR MDMSA « CoRSAIRe »)
Responsable : R. Gherbi ;
Chercheurs impliqués : D. Béroule, J.
Hérisson, P. Paroubek, W. Turner.
La génomique est une science récente et en pleine expansion. On dispose actuellement de la séquence intégrale de plusieurs centaines de génomes. Par ailleurs, il existe de vastes espaces informationnels sur le réseau mondial qui contiennent à la fois d'immenses banques de données factuelles (GenBank, SwissProt, etc.) et des millions de publications biomédicales (PubMed, MEDLINE, NIH, etc.). La mission difficile consiste à décrypter, en lien avec les biologistes, les données génomiques (identifier les structures et les fonctions), car les banques sont de très grandes tailles, hétérogènes, et dispersées. De plus, les interactions entre objets biologiques sont mises en valeur plutôt dans les données textuelles (articles scientifiques écrits en langue naturelle avec un vocabulaire spécialisé). Cette expansion de la génomique, mais aussi le développement ces dernières années des expérimentations produisant des données du transcriptome, sont en train de bouleverser complètement la manière de faire de la biologie, mais aussi l'impact et les débouchés applicatifs en thérapie, en pharmaceutique, en agriculture, et plus généralement dans les secteurs industriels des biotechnologies. Ils impliquent aussi la mise en place de puissants outils informatiques, qui doivent rester conviviaux, afin de traiter cet énorme flux mais aussi de maîtriser la complexité des informations.
Dans ce contexte, les travaux menés dans cet axe de VENISE visent la mise en œuvre et l'exploitation des potentialités offertes par la RV pour permettre une exploration conviviale et efficace de ces données. En effet, nous pensons qu'une approche intégrée est nécessaire, mettant en relation les outils de visualisation interactive et d'extraction de connaissances à partir de textes. On remarque souvent que ces données sont distribuées sur plusieurs sites avec très peu de passerelles transparentes entre eux. Il faut donc les rendre partageables et aisément accessibles aux dizaines de milliers d'utilisateurs potentiels. Nous voyons à cette intégration un double intérêt : d'une part la systématisation de la création de liens entre données factuelles et données textuelles augmenterait continuellement les connaissances sur les propriétés, les fonctions et les structures biologiques décrites dans les banques factuelles ; d'autre part et symétriquement, puisque ces liens influencent la compréhension des séquences identifiées, leur qualité doit être contrôlée, voire débattue de manière collaborative (in situ ou à distance) dans des situations d'interprétations variées. Ce double intérêt peut être considéré comme un enjeu clé de la bio-informatique documentaire, en complément à d'autres axes de recherche de ce domaine scientifique.
Dans un premier temps, nous nous appuyons en particulier sur les travaux menés dans les projets de veille technologique sur la microbiologie et la résistance aux antibiotiques (contrat avec le département SDV du CNRS, l'INIST-CNRS et l'Institut Gustave Roussy (IGR) Villejuif) et dans l'action bioinformatique AMTEFAG animés au LIMSI par W. Turner et P. Paroubek, ainsi que ceux de la plate-forme GenoMEDIA (Modélisation et Exploration 3D Interactive pour l'Analyse des génomes) développée sous la responsabilité de R. Gherbi au sein du groupe ``Geste et Image''. Le but recherché est de permettre à un biologiste de pouvoir interroger et naviguer entre des données factuelles (les représentations graphiques des séquences génomiques et leurs annotations) et des données textuelles (terminologies et connaissances extraites de résumés de publications scientifiques). Il s'agit par exemple de construire et d'associer des familles de gènes par le développement d'outils intégrés d'analyse des séquences et d'analyse textuelle de résumés bibliographiques concernant ces familles, cela dans le contexte de la base CancerGene (IGR) et de l'Atlas de cytogénétique. Les outils d'interaction 3d (voir plate-forme EVI3d ) conçus et développés au bénéfice de l'action transversale VENISE seront précieux pour la mise en place rapide d'expérimentations avec des utilisateurs, de sorte à affiner et évaluer nos choix techniques. Dans l'avenir, nous envisageons la systématisation de la création de liens entre données factuelles et données textuelles, avec l'exploration virtuelle comme ligne conductrice.
_______________
Contact : Rachid.Gherbi@limsi.fr
Action transversale VENISE
Copyright LIMSI-CNRS 2002.
Dernière modification :
visiteurs.