Question

我有以下XPath，我试图从中提取数据：

/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div

我试图通过Scrapy Shell测试这个，所以我做了以下几点：

scrapy shell "https://www.rentler.com/listing/520583"

然后：

hxs.select('/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div').extract()

但这会返回[]。

有什么想法吗？

修改

我想要这样做的全部原因是因为我需要将这5个项分解为单个变量，而不是一个数组（我目前正在使用它）：

<ul class="basic-stats">
<li>
<div class="count">4</div>
<div class="label">Bed</div>
</li>
<li>
<div class="count">2</div>
<div class="label">Bath</div>
</li>
<li>
<div class="count">1977</div>
<div class="label">Year</div>
</li>
<li>
<div class="count">1960</div>
<div class="label">SqFt</div>
</li>
<li>
<div class="count">0</div>
<div class="label">Acres</div>
</li>

Answer 1

我解决了这个问题。要访问上面的各个项目，只需添加li [1]，li [2]等

XPath在Scrapy中不起作用

1 个答案: