Implémentation d’une méthode de calcul de pertinence à priori d’un document

dc.contributor.authorKhelifa Souad
dc.contributor.otherHammache Arezki
dc.date.accessioned2021-02-28T10:33:39Z
dc.date.available2021-02-28T10:33:39Z
dc.date.issued2012
dc.description110 f. : ill. ; 30 cm. (+ CD-Rom)en
dc.description.abstractL’information joue certainement un rôle essentiel dans la société d’information d’aujourd’hui et la croissance exponentielle de sa volumétrie et de son nombre potentiel d’utilisateurs entrainent de nouveaux défis scientifiques dans tous les domaines dont la tâche principale est la gestion de l’information. La Recherche d’Information (RI) est sans conteste l’un des domaines les plus concernés. En effet, l’objectif principal de la RI est de fournir des modèles techniques et des systèmes pour stocker, organiser des masses d’informations et sélectionner dans ces masses celles qui répondent à certains critères. D’énormes efforts ont été déployés pour développer des approches et des techniques permettant de retrouver l’information voulue effectivement et efficacement à partir de vastes collections de données textuelles. Cependant, en raison de la surabondance de l’information d’une part et de sa large accessibilité à travers notamment le Web, d’autre part, leur mise en oeuvre est confrontée à de nouveaux problèmes. En effet, retrouver au sein d’un corpus de documents volumineux et hétérogène, les seuls documents qui répondent précisément aux besoins des utilisateurs est devenu difficile car cette croissance accentue le retour de documents non pertinents pour l’utilisateur final. Parmi les limites des systèmes actuels de RI est la non prise en compte de toutes les dimensions d’un document lors du processus de l’indexation et de la recherche. Ce qui engendre beaucoup de bruits en réponse à une requête d’un utilisateur. Parmi ces dimensions on peut citer : la taille d’un document, la structure des liens, le type d’URL d’un document,…etc. Dans notre cas, la caractéristique qu’on va utiliser est le score de dissemblance d’un document par rapport à une collection de documents c’est-à-dire qu’un document qui est dissemblable au reste des documents de la collection est à priori plus pertinent. Par la suite, on va formaliser cette hypothèse dans le cadre du modèle de langage. L’objectif de notre projet est d’implémenter une méthode pour calculer la pertinence à priori d’un document par rapport à une collection de documents. Pour ce faire, on l’a partagé en trois chapitres : - Le premier chapitre comporte la présentation des différents concepts de base et principaux modèles de la Recherche d’Information. - Dans le second chapitre, on a définit la modélisation de langage et la notion de calcul de pertinence de documents dans la Recherche d’Information sur le Web. - Dans le troisième chapitre, on a exposé notre approche ainsi que son implémentation et évaluation sur deux collections de tests AP88 et WSJ90-92. On termine par une conclusion et les perspectives possibles envisagées dans le cadre de ce travail.en
dc.identifier.citationSystéme Informatique
dc.identifier.otherMAST.INF.30-12en
dc.identifier.urihttps://dspace.ummto.dz/handle/ummto/12572
dc.language.isofren
dc.publisherUniversité Mouloud Mammerien
dc.subjectRecherche d'informartionen
dc.subjectModèle de langageen
dc.subjectNotion de pertinenceen
dc.subjectNet beansen
dc.titleImplémentation d’une méthode de calcul de pertinence à priori d’un documenten
dc.typeThesisen

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
KhelifaSouad.pdf
Size:
3.01 MB
Format:
Adobe Portable Document Format
Description:
PDF
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Plain Text
Description: