应用错误收集

无法使用Scrapy抓取某些链接

时间：2018-10-19 04:03:28

标签： python python-2.7 web-scraping scrapy screen-scraping

我遇到了一个奇怪的错误。我无法抓取链接https://www.example.com/2/

但是，我可以抓取链接https://www.example.com/922/

附言。由于我的工作不允许，因此我没有使用真实链接。抱歉。

1 个答案:

答案 0 :(得分：0)

当我尝试使用命令scrapy view https://www.example.com/2/对其进行调试时，它显示了我期望的正确HTML。当我通过Chrome检查器检查URL时，结果显示它提供了正确的HTML，但显示的错误状态为500，而不是200。我在蜘蛛网中使用handle_httpstatus_list = [500]解决了该问题。

Python，scrapy：抓取链接然后遍历这些链接以刮取更多链接
无法尝试使用Scrapy刮取分页链接
如何修改我的代码来刮掉这些链接？
无法从网页上抓取某些网址
使用scrapy框架抓起monster.com
使用xPath选择器时，无法抓取指向下一页的链接，返回空。（使用Scrapy）
抓取，抓取链接，然后抓取页面
无法使用Scrapy抓取某些链接
无法使用Scrapy抓取下一页内容
抓取一些子链接，然后返回主抓取工具

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？