使用SAX进行XML解析:如何在xml-tags中将html作为文本处理

时间:2011-11-06 13:22:30

标签: java xml sax saxparser

我从外部服务器获得xml响应。

使用一些教程我让SAX-Parser工作。

还有一个小问题。

在回复中有例如包含html的description标签:

<description><p><strong>Title</strong></p>Description</description> 

解析后,我的对象的描述字段只包含“&lt;”。

是否可以告诉我的解析器将html作为纯文本处理?

或许还有其他可能解决这个问题。

谢谢。

2 个答案:

答案 0 :(得分:2)

因为你没有包含你的代码,所以我必须想象你写的是什么。 SAX处理程序实现中的常见错误是不处理元素文本可能在多个characters()方法调用中返回的事实。你需要将它们全部聚合在一起,直到你得到endElement()事件。

答案 1 :(得分:0)

除了解决方案SAX问题之外,您可能会考虑使用Stax(javax.xml.stream)解决方案:它与SAX一样具有性能,但通常更方便。 您还可以强制合并文本内容(XMLInputFactory.IS_COALESCING)以避免出现与SAX相遇的问题。