Question

这是XML结构：

<tr>
   <td>
       <font size="3">
           <strong>Location:</strong> 
           Hiranandani Gardens, Powai
       </font>
   </td> 
</tr>

我要提取的是：Powai的Hiranandani Gardens

我尝试了这些：

response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()

response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()

两个人都返回了一个空列表。

注意：我们必须使用标记的文本，即“位置：”。否则，网站上还有许多其他地方使用相同的XML结构。因此，如果不使用强标签文本，它将获取除所需值之外的更多不必要的东西。

Answer 1

尝试在XPath下获取所需的输出

//font[@size="3" and normalize-space(strong)="Location:"]/text()

Xpath + Scrapy + Python：无法抓取数据点

1 个答案: