我有以下XPath,我试图从中提取数据:
/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div
我试图通过Scrapy Shell测试这个,所以我做了以下几点:
scrapy shell "https://www.rentler.com/listing/520583"
然后:
hxs.select('/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div').extract()
但这会返回[]
。
有什么想法吗?
修改
我想要这样做的全部原因是因为我需要将这5个项分解为单个变量,而不是一个数组(我目前正在使用它):
<ul class="basic-stats">
<li>
<div class="count">4</div>
<div class="label">Bed</div>
</li>
<li>
<div class="count">2</div>
<div class="label">Bath</div>
</li>
<li>
<div class="count">1977</div>
<div class="label">Year</div>
</li>
<li>
<div class="count">1960</div>
<div class="label">SqFt</div>
</li>
<li>
<div class="count">0</div>
<div class="label">Acres</div>
</li>
答案 0 :(得分:1)
我解决了这个问题。要访问上面的各个项目,只需添加li [1],li [2]等