这是XML结构:
<tr>
<td>
<font size="3">
<strong>Location:</strong>
Hiranandani Gardens, Powai
</font>
</td>
</tr>
我要提取的是:Powai的Hiranandani Gardens
我尝试了这些:
response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()
response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()
两个人都返回了一个空列表。
注意:我们必须使用标记的文本,即“位置:”。否则,网站上还有许多其他地方使用相同的XML结构。因此,如果不使用强标签文本,它将获取除所需值之外的更多不必要的东西。
答案 0 :(得分:3)
尝试在XPath下获取所需的输出
//font[@size="3" and normalize-space(strong)="Location:"]/text()