Slimani HayetYaici SouhilaAït El Hadj Fatiha2021-02-282021-02-282019Systéme InformatiqueMAST.INF.27-19https://dspace.ummto.dz/handle/ummto/1284183 f. : ill. ; 30 cm. (+ CD-Rom)L’objectif de notre travail est d’Acquérir les notions théoriques et pratiques nécessaires à la mise en oeuvre d’un meilleur outil d’acquisition automatisé de données sur le web. Notre projet se concentre particulièrement sur deux outils de web scraping : Scrapy et apach_nutch . Chaque outil fait l’objet d’une présentation théorique et d’exemples pratiques de programmation. Afin de pouvoir les comparer sur tous les aspects et proposer le meilleur outil qui récapitule, regroupe et synthétise les données selon le besoin de chacun de nous.frWeb scrapingScrapyApach-nutchExtraction de donnéesCrawlerItemPipeline-itemSpidersSolrIndexationEtude comparative de web scraping : Etude des outils scrapy et Apache-nutchThesis