如何在HTML <br/>标签之间拆分HTML / XML文本?

时间:2013-09-12 14:37:03

标签: xpath

我正在使用包含html和文本的文档,如下面的代码:

text1
<br/>
text2
<a><b>text2</b></a>
<br/>
<br/>
text3

我想要做的是依次提取每一行。如下例所示:

1) text1
2) text2 text2
3) text3

在一个数组中。我该怎么做?

由于

1 个答案:

答案 0 :(得分:1)

一种简单的方法是选择所有文本节点和所有br标签:

//text() | //br

然后遍历结果以使用连接字符串创建数组。