我正在使用Feed crawlIssues = wtr.GetCrawlIssues(encodedSiteID);从我的网站管理员工具帐户中获取抓取错误。有超过5k的错误,但上面的代码只检索前100个。如何检索所有错误?
由于
答案 0 :(得分:4)
我遇到了和你一样的问题,我也只收到了前100个错误。基本上,由于网站管理员工具中存在错误,它只会向您显示100个批次中的错误。
据我所知,它没有内置解决方案,但有一种解决方法。您可以使用提供的ExecRequest.exe命令行工具通过http请求访问数据,而不是使用GetCrawlIssues函数。基本用法是:
ExecRequest cl QUERY http://www.google.com/webmasters/tools/feeds/example_site.com/crawlissues/?start-index=1&max-results=100 example@gmail.com mypassword
这会将生成的XML输出到控制台。您可以指定起点和要下载的错误数:
?启动指数=的startIndex
& max-results = 100
您可以将最大结果值设置为您想要的值,但它最多只能下载100个项目。
批量下载后,您可以从下载的xml文件中获取数据。
如果你只需要数据,我也用Python编写了一个小脚本,你可以查看here,这很简单。