我在使用草率的FormRequest时遇到了麻烦。我正在尝试从此页面获得所有评论(无限滚动):https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041
滚动时,我可以看到数据格式为{xyz“:” 3“}的帖子请求
但是当我使用草率的命令行尝试时,我无法获得正确的响应。
from scrapy import FormRequest
fetch("https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041")
req = FormRequest(response.url, formdata={"xyz":"3"})
fetch(req)
我浏览了此页面:https://blog.scrapinghub.com/2016/06/22/scrapy-tips-from-the-pros-june-2016,但我仍然被卡住。
有人可以帮助我吗?
非常感谢! 米拉(Mylha)
答案 0 :(得分:0)
如果您更好地查看正在发出的请求,您会发现它实际上是到另一个URL的https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041
如果您向该网址提出表单请求,则会获得更新的数据:
>>> req = scrapy.FormRequest('https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041', formdata={'xyz': '3'})
>>> fetch(req)
2018-10-20 13:43:42 [scrapy.core.engine] DEBUG: Crawled (200) <POST https://www.temporel-voyance.com/voyants/temoignages?voyant_id=1041> (referer: None)
>>> response.css('.name_user b::text').getall()
['Chou', 'Jérôme', 'Sonia']