标签: python web-scraping scrapy screen-scraping nutch
我正在寻找下面的解决方案:
1-搜索搜索引擎中的给定关键字(Google,Yahoo ...)
2-收到结果(链接)
3-转到链接并提取内容......
经过简短的研究,我找到了“Apache Nutch”,我只想知道你的建议。
您对此解决方案有任何建议吗?
我解释的是否有更好的解决方案?
我是一名python开发人员,我熟悉像“Scrapy”这样的工具。
谢谢。
答案 0 :(得分:1)
要逐步构建搜索引擎,请访问http://blog.building-blocks.com/technical-tips/building-a-search-engine-with-nutch-and-solr-in-10-minutes