从XML节点中提取数字

时间:2016-02-29 04:01:22

标签: html xml xpath web-scraping

我用XPath做的最好(到目前为止)是提取以下节点:

<li class="List-guests">&#13;
<span class="icon guests"/>&#13;
3&#13;
</li>

我实际上只需要提取数字3.有没有办法在XPath中执行此操作?如果可以避免的话,我真的不想开始使用一些复杂的正则表达式。

2 个答案:

答案 0 :(得分:0)

您应该能够使用text()函数

答案 1 :(得分:0)

class="icon guests" span后的标准化文字,

normalize-space(//span[@class="icon guests"]/following-sibling::text())

以及class='List-guests' span

的规范化文字
normalize-space(//li[@class='List-guests'])
根据要求,

显示的XML将为3

注意:这是字符串3。如果您确实需要数字number(),则可以在3中包装上述任何一个XPath表达式。