Question

我在使用草率的FormRequest时遇到了麻烦。我正在尝试从此页面获得所有评论（无限滚动）：https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041

滚动时，我可以看到数据格式为{xyz“：” 3“}的帖子请求

但是当我使用草率的命令行尝试时，我无法获得正确的响应。

from scrapy import FormRequest

fetch("https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041")

req = FormRequest(response.url, formdata={"xyz":"3"})

fetch(req)

我浏览了此页面：https://blog.scrapinghub.com/2016/06/22/scrapy-tips-from-the-pros-june-2016，但我仍然被卡住。

有人可以帮助我吗？

非常感谢！米拉（Mylha）

Answer 1

如果您更好地查看正在发出的请求，您会发现它实际上是到另一个URL的https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041

如果您向该网址提出表单请求，则会获得更新的数据：

>>> req = scrapy.FormRequest('https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041', formdata={'xyz': '3'})
>>> fetch(req)
2018-10-20 13:43:42 [scrapy.core.engine] DEBUG: Crawled (200) <POST https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041> (referer: None)
>>> response.css('.name_user b::text').getall()
['Chou', 'Jérôme', 'Sonia']

Scrapy FormRequest

1 个答案: