Xpath + Scrapy + Python:无法抓取数据点

时间:2018-09-19 07:01:54

标签: python xpath scrapy

这是XML结构:

<tr>
   <td>
       <font size="3">
           <strong>Location:</strong> 
           Hiranandani Gardens, Powai
       </font>
   </td> 
</tr>  

我要提取的是:Powai的Hiranandani Gardens

我尝试了这些:

response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()

response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()

两个人都返回了一个空列表。

注意:我们必须使用标记的文本,即“位置:”。否则,网站上还有许多其他地方使用相同的XML结构。因此,如果不使用强标签文本,它将获取除所需值之外的更多不必要的东西。

1 个答案:

答案 0 :(得分:3)

尝试在XPath下获取所需的输出

//font[@size="3" and normalize-space(strong)="Location:"]/text()