真正复杂的情况。至少看起来对我来说。
我得到了什么?我可以转换为w3c节点的org.apache.xerces.dom.ElementNSImpl
列表。没问题。所以基本上我会List<Node>
。
但我的任务是在<br>
或<br/>
标记之间提取所有文字。当你看到xml的例子时会更清楚:
<Text>
<FONT color="blue">
<U>fhdgfhdfghdfghdfg</U>
</FONT>
<FONT color="blue">
<STRONG> dsfsfdfsghdfh:</STRONG>
</FONT>
<FONT color="blue"/>
<FONT color="blue">
<STRONG> 32423</STRONG>
</FONT>
<FONT color="blue">
<STRONG>-2013<br/>
</STRONG>
</FONT>
<STRONG>- dkjhgkjsdhgf</STRONG> sdafas asd fasdf 17-05-12<br/>- fgdhdfh gsdfg fdg 8-400 <br/>
<STRONG>- </STRONG>
<STRONG>dfdfgsdf </STRONG> dfgsdfgsdfgsdg.......................................<br/>-
<STRONG>sdfasdfasfdas </STRONG>asdfasasddfsdgdfsgsdf.......<br/>
</Text>
对于输出,我必须创建字符串,这将与“&#39; br&#39;标签。这样的东西将输出这个xml:
string 1:fhdgfhdfghdfghdfg dsfsfdfsghdfh:32423-2013
string 2: - dkjhgkjsdhgf sdafas asd fasdf 17-05-12
string 3: - fgdhdfh gsdfg fdg 8-400
字符串4: - dfdfgsdf dfgsdfgsdfgsdg .......................................
字符串5: - sdfasdfasfdas asdfasasddfsdgdfsgsdf .......
有关如何处理此事的任何建议吗?