Recherche et filtrage d’information basés sur le Text Mining sous la technologie GRID

Loading...
Thumbnail Image
Date
2008
Journal Title
Journal ISSN
Volume Title
Publisher
Universite Badji Mokhtar
Abstract
La quantité d’information textuelle augmente de façon exponentielle aussi bien comme archives que documents de travail dans les organisations académiques, dans les administrations et dans les entreprises. Il est très difficile aux engins de recherche de retrouver l'information adéquate dans cet important volume de données textuelle, reflétant les intérêts des utilisateurs qui changent avec le temps. Nous avons donc besoin de techniques d'apprentissage permettant de reconnaître les intérêts des utilisateurs en donnant uniquement une simple requête, et de filtrer l’information disponible suivant ces intérêts, et donc de mettre en place un système de recherche et de filtrage d’informations. Dans ce travail, on propose une architecture du système de recherche et filtrage d’information basé sur le Text Mining sous la technologie GRID, capable de constituer et consulter une base de données d'une part, et de filtrer l'information disponible suivant les besoins des utilisateurs d'une autre part. Le mécanisme de filtrage est à la base du Text Mining, pour le quel on a appliqué les techniques du GRID pour améliorer les performances de calcule, il réalise la modélisation des intérêts des utilisateurs et, le filtrage d’information; en effet, ces informations sont d'abord proposés par la rétroaction de l'utilisateur, et des mots sont ensuite sélectionnés pour créer un profil. En utilisant ce profil, l'information entrante est filtrée et ainsi, plus d’informations pertinentes sont présentée à l'utilisateur associé. L’architecture du système de recherche et filtrage d’information basé sur le Text Mining sous la technologie GRID (RFITM-GRID) que nous avons proposé se compose de plusieurs modules : Un module d'indexation, qui, en balayant un ou plusieurs fichiers, il construit un index avec les mots trouvés dans les documents. Un module moteur de recherche, qui permet de réaliser une recherche d’information en consultant les fichiers de la base de donnée créer par le module d’indexation. Un module de filtrage, qui, à base de la rétroaction de pertinence et du Text Mining, en exploitant les hautes performances du GRID, crée des profils, qu'il exploite par la suite pour filtrer l'information entrante.
Description
Keywords
Recherche d’information, Grille de calcule (GRID), Rétroaction de pertinence, filtrage d’information, Profil utilisateur, Bases de donnés : connaissances, Text Mining
Citation
Collections