Scrapy FormRequest

时间:2018-10-20 11:01:07

标签: python scrapy http-post infinite-scroll

我在使用草率的FormRequest时遇到了麻烦。我正在尝试从此页面获得所有评论(无限滚动):https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041

滚动时,我可以看到数据格式为{xyz“:” 3“}的帖子请求

但是当我使用草率的命令行尝试时,我无法获得正确的响应。

from scrapy import FormRequest

fetch("https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041")

req = FormRequest(response.url, formdata={"xyz":"3"})

fetch(req)

我浏览了此页面:https://blog.scrapinghub.com/2016/06/22/scrapy-tips-from-the-pros-june-2016,但我仍然被卡住。

有人可以帮助我吗?

非常感谢! 米拉(Mylha)

1 个答案:

答案 0 :(得分:0)

如果您更好地查看正在发出的请求,您会发现它实际上是到另一个URL的https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041

如果您向该网址提出表单请求,则会获得更新的数据:

>>> req = scrapy.FormRequest('https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041', formdata={'xyz': '3'})
>>> fetch(req)
2018-10-20 13:43:42 [scrapy.core.engine] DEBUG: Crawled (200) <POST https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041> (referer: None)
>>> response.css('.name_user b::text').getall()
['Chou', 'Jérôme', 'Sonia']