Classification de courriers électroniques : Une approche par apprentissage basée sur des modèles linguistiques

Nouali, Omar; Blache, Philippe

Classification de courriers électroniques : Une approche par apprentissage basée sur des modèles linguistiques

Date

2005

Authors

Nouali, Omar

Blache, Philippe

Publisher

Lavoisier, Cachan cedex FRANCE

Abstract

Nous proposons une double amélioration des systèmes de filtrage de courriels existants. D’une part, en utilisant une méthode d’apprentissage automatique permettant à un système de filtrage d’élaborer des profils utilisateur. D’autre part, nous utilisons un ensemble de connaissances linguistiques sous forme de modèles réduits issues de modèles linguistiques de textes. Dans ce contexte, nous cherchons à évaluer si l’utilisation de connaissances et de traitements linguistiques peut améliorer les performances d’un système de filtrage. En effet, nous utilisons, au-delà des caractéristiques lexicales, un ensemble d’indicateurs sur le message portant sur la structure et le contenu. Ces connaissances sont indépendantes du domaine d’application et la fiabilité repose sur l’opération d’apprentissage. Pour tenter de statuer sur la faisabilité de notre approche et d’évaluer son efficacité, nous l’avons expérimenté sur un corpus de 1 200 messages. Nous présentons les résultats d’un ensemble d’expériences d’évaluation

Keywords

Filtrage d’information, Apprentissage automatique, Modèles linguistiques réduits

URI

http://dl.cerist.dz/handle/CERIST/464

Collections

International Journal Papers

Full item page

Classification de courriers électroniques : Une approche par apprentissage basée sur des modèles linguistiques

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By