我之前已经意识到类似的问题,解决方法是使用StringEscapeUtils.unescape()。但是,根据方法说明:
仅支持五种基本XML 实体(gt,lt,quot,amp,apos)。 不支持DTD或外部 实体。
我有一堆带有转义字符的XML文件,例如␣
和&hyph;
。我怎么能解开这些?它们在提供的DTD中定义。是否有像StringEscapeUtils这样的方法,但有一个支持DTD的方法?
答案 0 :(得分:0)
嗯,已经很长时间了,但我认为EntityResolver2
(Java SDK)的实现处理外部定义的实体。这是SAX2规范的一部分。