如何在Java中用XML来解决XML中的非标准字符?

时间:2011-05-16 02:46:32

标签: java xml xml-parsing

我之前已经意识到类似的问题,解决方法是使用StringEscapeUtils.unescape()。但是,根据方法说明:

  

仅支持五种基本XML   实体(gt,lt,quot,amp,apos)。   不支持DTD或外部   实体。

我有一堆带有转义字符的XML文件,例如␣&hyph;。我怎么能解开这些?它们在提供的DTD中定义。是否有像StringEscapeUtils这样的方法,但有一个支持DTD的方法?

1 个答案:

答案 0 :(得分:0)

嗯,已经很长时间了,但我认为EntityResolver2(Java SDK)的实现处理外部定义的实体。这是SAX2规范的一部分。