我创建了一个谷歌电子表格,定期从某个webpage检索数据,并且它可以完美地工作大约一个月。然而,在前天(19/08)之后,它突然给importxml()和importhtml()提供了“无法获取URL”错误,即使网站本身在使用浏览器时仍然没有问题。与此同时,电子表格上没有任何变化,除了它已经分发给其他人。
spreadsheet (当然,你可以自由复制它;它涉及细胞H1和A2)
我尝试过的解决方案:
- Google脚本的Urlfetchapp();它似乎能够没有问题地获取网页(但没有importhtml内置的格式化)
- 在importhtml中包含trim()以删除网址中的任何潜在空格
- 尝试了sfstat.info的多个其他子域(例如sfstat.info/na/pantheons/);所有sfstat.info网页似乎都给出了同样的错误。
- 尝试获取其他网址,例如Google等。这些网址没有问题
- Excel相当于importhtml。这似乎也没有问题。
- 虽然电子表格在技术上将& minute(now())添加到网址,但删除此功能也无法解决“无法获取网址”问题。
- 下载&在Google云端硬盘上托管了该网页,并试图使用importhtml& amp; IMPORTXML;这也没有导致问题。因此可能由于大量请求而将获取视为DoS尝试。
先感谢您。
答案 0 :(得分:1)
确实不是导致此问题的电子表格;显然谷歌向域名sfstat.info发送了大量请求(6小时内超过10k),导致IP被阻止。