如何在scrapy中更改url长度?

时间:2014-11-07 09:15:07

标签: python web-scraping scrapy

我在scrapy中使用FormRequest.from_response模块来刮取一些总线信息。每当我运行我的蜘蛛时,它会通过提供以下信息来忽略发布请求:

DEBUG: Ignoring link (url length > 2083):

scrapy文档中提到的详细信息如下:

URLLENGTH_LIMIT
Default: 2083
Scope: contrib.spidermiddleware.urllength

有人可以告诉我如何更改此设置吗?

2 个答案:

答案 0 :(得分:0)

事实证明,由于我没有指定发布请求的方法类型,因此引发了此错误。我刚刚在FormRequest参数中添加了以下内容,一切正常:

method="POST"

答案 1 :(得分:0)

在scrappy的settings.py中 添加这个

URLLENGTH_LIMIT = (integer)

了解详情scrappy