使用XPath忽略/跳过已知或所有从属标记

时间:2011-03-04 18:20:18

标签: xml xpath tags

我正在使用带有Hpple / libxml2的XPath来解析iOS / iPhone OS中的HTML。我现在想在解析文档时忽略某个标记,如粗体标记<b>

例如来自代码

<div>foo<b>bar</b></div>

应选择字符串“foo”和“bar”并连接,从而形成“foobar”。

在查看相关请求之后我觉得他们可能无法解决这个问题,但我绝对错了。如果是这样,请通过上面的示例告诉我并举例说明。

谢谢。

1 个答案:

答案 0 :(得分:2)

使用

string(/*)

根据提供的XML文档进行评估

<div>foo<b>bar</b></div>

产生了想要的正确结果:

foobar

<强>解释

根据XPath 1.0 W3C specification

元素节点的字符串值是文档顺序中元素节点的所有文本节点后代的字符串值的串联