Indexation sémantique latente de documents textuels

dc.contributor.authorAliouane Dyhia
dc.contributor.otherBoubekeur Fatiha ép. Amirouche
dc.date.accessioned2021-02-28T10:47:18Z
dc.date.available2021-02-28T10:47:18Z
dc.date.issued2012
dc.description81 f. : ill. ; 30 cm. (+ CD-Rom)en
dc.description.abstractDepuis l’essor de l’informatique, le volume d’information stockée électroniquement ne cesse de s’accroitre. Ce qui rend le besoin de disposer de systèmes permettant un accès intelligent à l’information de plus en plus indispensable. Les travaux présentés dans ce mémoire se situent dans le contexte générale de l’utilisation de la sémantique pour la représentation de l’information dans les systèmes de RI. Nous nous positionnons plus particulièrement dans le cadre de l’indexation sémantique latente. La première partie du mémoire consacrée à la présentation des principaux modèles de recherche et à la description du processus d’indexation a permis de dégager certaines limites de ces systèmes basées sur une indexation dite classique. En effet, dans ces systèmes, un document est sélectionné s’il contient les mêmes mots que ceux de la requête. Dans ces systèmes, un document contenant des termes de la requête et qui est non pertinent est retourné, alors qu’un document pertinent ne partageant pas des mots avec la requête est ignoré. De nombreuses activités ont été menées pour améliorer ces approches d’indexation classiques en incorporant la sémantique dans le processus de RI. Nous avons enchainé notre travaille avec l’étude de l’approche sémantique qui se base sur l’indexation par la sémantique latente qui résout les sens des mots par un clustering des mots sémantiquement proches via une technique de réduction de la dimensionnalité de la matrice termes-documents « SVD ». Les systèmes qui se basent sur cette approche sémantique permettent de fournir, en réponse à une requête de l’utilisateur un document se rattachant au même thème que la requête même s’il n’existe pas (ou peu) de mots communs entre l’un est l’autre. Nous avons présenté un état de l’art sur LSI, comme nous avons décrit quelques variantes de cette approche. Le principale apport de ce mémoire est l’intégration de l’approche LSI dans la plate forme de RI Terrier. Ainsi, nous avons testé notre approche sur la collection Time en utilisant le système LSI-Terrier résultant de l’intégration de LSI dans Terrier.en
dc.identifier.citationSystéme Informatique
dc.identifier.otherMAST.INF.32-12en
dc.identifier.urihttps://dspace.ummto.dz/handle/ummto/12909
dc.language.isofren
dc.publisherUniversité Mouloud Mammerien
dc.subjectRecherche d’informationen
dc.subjectIndexation sémantique latente « LSI »en
dc.subjectdécomposition en valeurs singulière « SVD »en
dc.subjectplateforme Terrier-3.5en
dc.titleIndexation sémantique latente de documents textuelsen
dc.typeThesisen

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
AliouaneDyhia.pdf
Size:
1.03 MB
Format:
Adobe Portable Document Format
Description:
PDF
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Plain Text
Description: