应用错误收集

时间：2015-09-08 21:46:52

标签： scrapy

我一直在为许多新闻网站开发一个抓取脚本，并使用Scrapy来处理逻辑。

当我在Ubuntu网络服务器上运行我的脚本时（数字海洋，如果这有帮助），很多在本地机器上返回200的网站变成了417。

我想知道如何解决这个问题，如果这是一个问题呢？我实际上不太确定它是否会影响最终输出，但它似乎已经存在。

我自己的一些研究已经出现了：

答案 0 :(得分：0)

417是Web服务器在您的客户端表示期望内容类型为a，b，c时提供的错误，但服务器可以提供的内容与这些类型中的任何一种都不匹配。

这看起来像是一个scrapy bug，或者更可能是错误配置。