Utilisation de bases terminologiques
pour la recherche d'information



Jian-Yun Nie, Université de Montréal.



deux Shadoks stochastiques


le 10 avril 2000 (exceptionnellement, un lundi)
Séminaire du Département Communication Homme-Machine


Les approches classiques de la recherche d'information sont toutes fondées sur des mots clés. Un mot clé est utilisé comme l'unique représentant d'un sens. Cette utilisation peut entraîner un taux élevé de bruit et de silence : les documents contenant le même index peuvent concerner un autre sujet (ambiguïté de mots), et les documents indexés par d'autres mots clés reliés ne seront pas retrouvés.

Une base de terminologie peut être utilisée pour fournir une solution partielle à ces problèmes. Elle permet d'identifier les termes composés qui sont de meilleurs représentants sémantiques. Elle permet aussi de déterminer les termes reliés. Dans cette présentation, seront décrites deux séries de tests effectués en utilisant deux bases différentes : Wordnet et la BTQ (Banque de terminologie du Québec). En particulier, les relations entre les termes stockées dans Wordnet sont d'abord pondérées en utilisant des informations de pertinence (relevance feedback). Ces tests montrent qu'on peut obtenir des améliorations significatives en RI en utilisant ces ressources.