Recherche et filtrage d’information basés sur le Text Mining sous la technologie GRID
Loading...
Date
2008
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universite Badji Mokhtar
Abstract
La quantité d’information textuelle augmente de façon exponentielle aussi bien comme
archives que documents de travail dans les organisations académiques, dans les administrations et
dans les entreprises.
Il est très difficile aux engins de recherche de retrouver l'information adéquate dans cet
important volume de données textuelle, reflétant les intérêts des utilisateurs qui changent avec le
temps. Nous avons donc besoin de techniques d'apprentissage permettant de reconnaître les
intérêts des utilisateurs en donnant uniquement une simple requête, et de filtrer l’information
disponible suivant ces intérêts, et donc de mettre en place un système de recherche et de filtrage
d’informations.
Dans ce travail, on propose une architecture du système de recherche et filtrage
d’information basé sur le Text Mining sous la technologie GRID, capable de constituer et
consulter une base de données d'une part, et de filtrer l'information disponible suivant les besoins
des utilisateurs d'une autre part.
Le mécanisme de filtrage est à la base du Text Mining, pour le quel on a appliqué les
techniques du GRID pour améliorer les performances de calcule, il réalise la modélisation des
intérêts des utilisateurs et, le filtrage d’information; en effet, ces informations sont d'abord
proposés par la rétroaction de l'utilisateur, et des mots sont ensuite sélectionnés pour créer un
profil. En utilisant ce profil, l'information entrante est filtrée et ainsi, plus d’informations
pertinentes sont présentée à l'utilisateur associé.
L’architecture du système de recherche et filtrage d’information basé sur le Text Mining
sous la technologie GRID (RFITM-GRID) que nous avons proposé se compose de plusieurs modules : Un module d'indexation, qui, en balayant un ou plusieurs fichiers, il construit un index avec les
mots trouvés dans les documents.
Un module moteur de recherche, qui permet de réaliser une recherche d’information en
consultant les fichiers de la base de donnée créer par le module d’indexation.
Un module de filtrage, qui, à base de la rétroaction de pertinence et du Text Mining, en
exploitant les hautes performances du GRID, crée des profils, qu'il exploite par la suite pour filtrer l'information entrante.
Description
Keywords
Recherche d’information, Grille de calcule (GRID), Rétroaction de pertinence, filtrage d’information, Profil utilisateur, Bases de donnés : connaissances, Text Mining