Question

真正复杂的情况。至少看起来对我来说。我得到了什么？我可以转换为w3c节点的org.apache.xerces.dom.ElementNSImpl列表。没问题。所以基本上我会List<Node>。

但我的任务是在<br>或<br/>标记之间提取所有文字。当你看到xml的例子时会更清楚：

<Text>
    <FONT color="blue">
        <U>fhdgfhdfghdfghdfg</U>
    </FONT>
    <FONT color="blue">
        <STRONG>      dsfsfdfsghdfh:</STRONG>
    </FONT>
    <FONT color="blue"/>
    <FONT color="blue">
        <STRONG> 32423</STRONG>
    </FONT>
    <FONT color="blue">
        <STRONG>-2013<br/>
        </STRONG>
    </FONT>
    <STRONG>- dkjhgkjsdhgf</STRONG> sdafas asd fasdf 17-05-12<br/>- fgdhdfh gsdfg fdg 8-400 <br/>
    <STRONG>- </STRONG>
    <STRONG>dfdfgsdf </STRONG> dfgsdfgsdfgsdg.......................................<br/>- 
    <STRONG>sdfasdfasfdas </STRONG>asdfasasddfsdgdfsgsdf.......<br/>
</Text>

对于输出，我必须创建字符串，这将与“＆＃39; br＆＃39;标签。这样的东西将输出这个xml：

string 1：fhdgfhdfghdfghdfg dsfsfdfsghdfh：32423-2013

string 2： - dkjhgkjsdhgf sdafas asd fasdf 17-05-12

string 3： - fgdhdfh gsdfg fdg 8-400

字符串4： - dfdfgsdf dfgsdfgsdfgsdg .......................................

字符串5： - sdfasdfasfdas asdfasasddfsdgdfsgsdf .......

有关如何处理此事的任何建议吗？

在{tag

0 个答案: