我在抓这张页面的表格:
http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/
有一个包含多个页面的表,通过XMLHttpRequest进行更改,检查我可以获取此请求的页面
但我不能用scrapy刮掉这个网址
当我尝试:
scrapy shell http://www.trulia.com/q_schools_in_district.php?did=600116051&grade=elementary&page=2&sortby=testRating&sortdir=desc
我没有得到回应,这些数据如何被删除?
答案 0 :(得分:1)
[最初由eLRuLL在评论中发布]
使用""
覆盖您的网址,因为第二个网址包含&
,shell也会识别该网址以运行其他进程。