Indexation sémantique de documents textuels

Loading...
Thumbnail Image

Date

2012

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

Nous avons décrit dans ce mémoire une nouvelle approche d’indexation sémantique (proposée par Amirouche [Amirouche, 11]). Cette approche porte sur les trois aspects de l’indexation sémantique : (1) la détection des termes d’index qui consiste à retrouver l’ensemble des collocations, l’ensemble des termes simples et l’ensemble des termes orphelins. (2) la désambiguïsation des termes qui consiste à sélectionner le sens correct de chaque mot simple dans le document et (3) la pondération des termes, où nous avons proposé un nouveau schéma de pondération basé sur la similarité sémantique (plus le terme est relié sémantiquement aux autres termes du document plus il est important). Par la suite, nous avons intégré cette nouvelle approche à la plateforme de Terrier 3.5, formant ainsi Sem-Terrier, et ce, en ajoutant un module pour l’identification des termes d’index et leur désambiguïsation, et le nouveau modèle de pondération pour le calcul des scores.

Description

113 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Recherche D’Information, Indexation Sémantique, Désambiguïsation Des Sens Des Mots, Wordnet, Terrier-3.5

Citation

Systéme Informatique