Indexation sémantique de documents textuels
Loading...
Date
2012
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mouloud Mammeri
Abstract
Nous avons décrit dans ce mémoire une nouvelle approche d’indexation sémantique (proposée par Amirouche [Amirouche, 11]). Cette approche porte sur les trois aspects de l’indexation sémantique : (1) la détection des termes d’index qui consiste à retrouver l’ensemble des collocations, l’ensemble des termes simples et l’ensemble des termes orphelins. (2) la désambiguïsation des termes qui consiste à sélectionner le sens correct de chaque mot simple dans le document et (3) la pondération des termes, où nous avons proposé un nouveau schéma de pondération basé sur la similarité sémantique (plus le terme est relié sémantiquement aux autres termes du document plus il est important). Par la suite, nous avons intégré cette nouvelle approche à la plateforme de Terrier 3.5, formant ainsi Sem-Terrier, et ce, en ajoutant un module pour l’identification des termes d’index et leur désambiguïsation, et le nouveau modèle de pondération pour le calcul des scores.
Description
113 f. : ill. ; 30 cm. (+ CD-Rom)
Keywords
Recherche D’Information, Indexation Sémantique, Désambiguïsation Des Sens Des Mots, Wordnet, Terrier-3.5
Citation
Systéme Informatique