是否有类似于Yahoo和Bing的API的Google API来检查指定域上的索引页数?
例如,对于Yahoo,如果我键入以下URL:
然后它会返回一些XML,详细说明索引为'totalResultsAvailable'的页面数
有什么想法吗?
由于
答案 0 :(得分:3)
我不确定API,但您可以通过执行搜索来查看Google已编入索引的网页:
site:http://thesitesurl.com
Here is an example。您可以将一些逻辑应用于每页的分页和项目数等(或者只使用“结果1 - 100约9,100,000”)。您甚至可以选择使用this sort of syntax每页显示100个项目。我不确定这是否符合您的确切要求,但它总比没有好。
答案 1 :(得分:2)
仍在运行 - 但已弃用 - Google搜索API可以执行此操作:
http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=www.bbc.co.uk
返回的结果是“text / javascript”类型,您可以将其解析为JSON。您追踪的字段是estimatedResultCount
。似乎没有将结果作为XML返回的选项,但您需要做的就是将JSON转换为XML。我不知道你正在使用什么语言,但必须有实用程序才能做到这一点。
如果您不想使用已弃用的API,请使用新的自定义搜索API - 但您需要注册API密钥:
http://code.google.com/apis/customsearch/v1/overview.html
以及有关如何构建查询的详细信息: