如何下载Google搜索结果?

时间:2009-05-24 13:17:48

标签: web-crawler

道歉,如果这个问题太无知或以前被问到过。粗略的外观没有发现任何与此完全匹配的东西。问题是:如何下载Google编入索引的所有Word文档?确实是手工完成这项工作真是一项艰巨的任务......感谢所有指针。

1 个答案:

答案 0 :(得分:2)

我担心,没有合法的方法可以做到这一点。以前谷歌为他们的网络搜索提供了一个SOAP API,但it's deprecated and to be closed this summer。它每天限制1000个查询。

目前Google提供Ajax Search API,但它没有为您提供任何解决方案,因为最大的结果集包含8个结果。

最后,google.com处有标准的网络表单,禁止以编程方式查询。 (还有一个限制,谷歌只返回前千个结果,你看不到更多。)

如果您想在此建立服务,可以与Google联系并与他们建立合作关系。