Utilisation de bases terminologiques
pour la recherche d'information
Jian-Yun Nie, Université de Montréal.
le 10 avril 2000 (exceptionnellement, un lundi)
Séminaire du Département Communication Homme-Machine
Les approches classiques de la recherche d'information sont toutes
fondées sur des mots clés. Un mot clé est utilisé
comme l'unique représentant
d'un sens. Cette utilisation peut entraîner un taux élevé
de bruit et de
silence : les documents contenant le même index
peuvent concerner un autre sujet
(ambiguïté de mots), et les documents indexés par d'autres mots clés
reliés ne seront pas retrouvés.
Une base de terminologie peut être utilisée pour fournir une solution
partielle à ces problèmes. Elle permet d'identifier les termes composés qui
sont de meilleurs représentants sémantiques. Elle permet aussi de déterminer
les termes reliés. Dans cette présentation, seront décrites deux séries de
tests effectués en utilisant deux bases différentes :
Wordnet et la BTQ
(Banque de terminologie du Québec). En particulier, les relations entre les
termes stockées dans Wordnet sont d'abord pondérées en utilisant des
informations de pertinence (relevance feedback). Ces tests montrent qu'on
peut obtenir des améliorations significatives en RI en utilisant ces
ressources.