Calcul de Similarité entre Textes pour le Développement des Requêtes

Loading...
Thumbnail Image
Date
2013
Journal Title
Journal ISSN
Volume Title
Publisher
Université M’HAMED BOUGUERRA
Abstract
Dans le cadre de ce projet, nous nous proposons de développer un système de calcul de similarité entre textes, basé sur une organisation vectorielles des données, aussi bien le contenu (corpus de documents) que les besoins (requêtes d'utilisateurs), et comment ça pourrait améliorer la qualité de filtrage l'information par les systèmes de recherche dans le but de retourner les contenus les plus pertinents. Pour cela, nous allons d’abord nous intéresser au domaine de la recherche d’information sur Internet, communément appelé la RI (Information Retrieval IR). Ce sera l’objet du chapitre 1, ou nous allons présenter les principes de base des systèmes de recherche d’information (les SRI), ainsi que les principaux modèles existants de structuration de données textuelles (booléen, flou, vectoriel …etc.). Dans le chapitre 2, nous allons pencher plus en détail sur le modèle vectoriel de représentation de documents, d’abord en présentant ses fondements mathématiques, ensuite le processus de traitement, et pour finir les domaines d’application qui adoptent ce modèle. La suite sera consacrée au système que nous nous proposons de développer dans le cadre de ce projet. La conception de notre application fera l’objet du chapitre 3 ou nous allons présenter l’architecture globale de notre système ainsi que le fonctionnement interne de chaque module qui le constitue. Tandis que le chapitre 4 sera réservé à l’implémentation de l’application, à travers les outils de développement utilisés, quelques algorithmes décrivant les fonctions essentielles ainsi que les interfaces graphiques qui permettent l’interaction avec l’utilisateur. Nous terminerons par une discussion des performances du système conçus et développés, suivi d’une conclusion qui fera la synthèse du travail accompli, tout en énumérant quelques points qui n’ont pu être accompli dans le cadre de ce travail et qui feront l’objet de futurs projets
Description
Keywords
Système de calcul de similarité, Systèmes de recherche d’information, Information Retrieval IR, Corpus de documents, Requêtes d'utilisateurs, Requêtes : développement
Citation
Collections