org.xml.sax.SAXParseException:引用了实体“ndash”,但未声明

时间:2010-03-10 00:19:05

标签: xml exception entity saxon saxparser

我正在解析以下内容......

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE tox:message SYSTEM "http://tox.sf.net/tox/dtd/tox.dtd">
<tox:message xmlns:tox="http://tox.sourceforge.net/">
<tox:model owner="scott" package="queue" function="appendFact">
<tox:parameter value="  By John Smith   &ndash; Thu Feb 25, 4:54 pm ET&lt;br&gt;&lt;br&gt;NEW YORK (Reuters) &ndash; Nothing happened today."/>
<tox:parameter value="10245"/>
</tox:model>
</tox:message>

...使用saxon9.jar,但得到了......

org.xml.sax.SAXParseException: The entity "ndash" was referenced, but not declared.

如何“声明”实体进行解析?我如何能够预测所有潜在的实体?

2 个答案:

答案 0 :(得分:1)

您在DTD中声明它。由于您使用的是外部DTD,因此必须为您声明。 tox.dtd是否包含ndash的声明?

如果没有,你需要做一些灵感来自:

<!DOCTYPE foo [
    <!ENTITY % MathML SYSTEM "http://www.example.com/MathML.dtd">
    %MathML;
    <!ENTITY % SpeechML SYSTEM "http://www.example.com/SpeechML.dtd">
    %SpeechML;
]>

您可以使用其中一个定义ndash的标准XHTML dtd,例如。

如果tox.dtd确实声明了它,那么你需要一个解析器才能找到它。

答案 1 :(得分:0)