嵌套节点的xPath表达式

时间:2011-11-08 22:11:51

标签: xpath htmlcleaner

我正在尝试提出一个复杂的xPath表达式,但我无法弄清楚如何做到这一点。想象一下,你有这样的HTML:

<span>
    something1
    <br>
    something2
    <br>
    something3
</span>

想象一下,有时第二个<br>和随后的“something3”不存在。我想创建一个xPath表达式,它将所有span节点及其内容带到第一个<br>,这样我最终只能解析“something1”。我不知道这是否可行,如果没有人知道在解析了所有<span>个节点后得到它的方法吗?

我不得不说我正在使用HtmlParser,这是一个解析HTML并支持xPath表达式的Java库。

谢谢,

Masiar

1 个答案:

答案 0 :(得分:1)

我对你对问题的描述感到有些困惑,但听起来像是

//span/br[1]/preceding-sibling::text()