Importhtml()& Importxml()“无法获取URL” - 仅在特定网页上

时间:2015-08-21 06:26:28

标签: google-apps-script google-sheets

我创建了一个谷歌电子表格,定期从某个webpage检索数据,并且它可以完美地工作大约一个月。然而,在前天(19/08)之后,它突然给importxml()和importhtml()提供了“无法获取URL”错误,即使网站本身在使用浏览器时仍然没有问题。与此同时,电子表格上没有任何变化,除了它已经分发给其他人。

spreadsheet (当然,你可以自由复制它;它涉及细胞H1和A2)

我尝试过的解决方案:
- Google脚本的Urlfetchapp();它似乎能够没有问题地获取网页(但没有importhtml内置的格式化) - 在importhtml中包含trim()以删除网址中的任何潜在空格 - 尝试了sfstat.info的多个其他子域(例如sfstat.info/na/pantheons/);所有sfstat.info网页似乎都给出了同样的错误。
- 尝试获取其他网址,例如Google等。这些网址没有问题 - Excel相当于importhtml。这似乎也没有问题。
- 虽然电子表格在技术上将& minute(now())添加到网址,但删除此功能也无法解决“无法获取网址”问题。
- 下载&在Google云端硬盘上托管了该网页,并试图使用importhtml& amp; IMPORTXML;这也没有导致问题。因此可能由于大量请求而将获取视为DoS尝试。

先感谢您。

1 个答案:

答案 0 :(得分:1)

确实不是导致此问题的电子表格;显然谷歌向域名sfstat.info发送了大量请求(6小时内超过10k),导致IP被阻止。