Apache Nutch的替代方案?

时间:2014-10-31 06:47:53

标签: python web-scraping scrapy screen-scraping nutch

我正在寻找下面的解决方案:

1-搜索搜索引擎中的给定关键字(Google,Yahoo ...)

2-收到结果(链接)

3-转到链接并提取内容......

经过简短的研究,我找到了“Apache Nutch”,我只想知道你的建议。

您对此解决方案有任何建议吗?

我解释的是否有更好的解决方案?

我是一名python开发人员,我熟悉像“Scrapy”这样的工具。

谢谢。

1 个答案:

答案 0 :(得分:1)