Java:将XML文档解析为文本时出错

时间:2015-03-20 09:50:37

标签: java xml-parsing

我尝试使用以下

将XML文档解析为String
Document parse = DocumentBuilderFactory.newInstance().newDocumentBuilder()
                .parse(new InputSource(new StringReader(xmlFile)));

但我收到此错误

[致命错误]实体" Ouml"被引用,但未被声明。

我尝试使用Apache StringEscapeUtils转义并使用unescape xmlFile String但仍然有错误

1 个答案:

答案 0 :(得分:2)

HTML 4.0知道252个预定义的字符实体,如Öß等。

另一方面,XML只有5:

"
&
'
<
>

你不能使用html中的命名字符实体,而不是那些没有先定义它们的字符实体。

因此,在使用StringEscapeUtils时,请确保使用escapeXml()代替escapeHtml4()