我正在解析以下内容......
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE tox:message SYSTEM "http://tox.sf.net/tox/dtd/tox.dtd">
<tox:message xmlns:tox="http://tox.sourceforge.net/">
<tox:model owner="scott" package="queue" function="appendFact">
<tox:parameter value=" By John Smith – Thu Feb 25, 4:54 pm ET<br><br>NEW YORK (Reuters) – Nothing happened today."/>
<tox:parameter value="10245"/>
</tox:model>
</tox:message>
...使用saxon9.jar,但得到了......
org.xml.sax.SAXParseException: The entity "ndash" was referenced, but not declared.
如何“声明”实体进行解析?我如何能够预测所有潜在的实体?
答案 0 :(得分:1)
您在DTD中声明它。由于您使用的是外部DTD,因此必须为您声明。 tox.dtd是否包含ndash的声明?
如果没有,你需要做一些灵感来自:
<!DOCTYPE foo [
<!ENTITY % MathML SYSTEM "http://www.example.com/MathML.dtd">
%MathML;
<!ENTITY % SpeechML SYSTEM "http://www.example.com/SpeechML.dtd">
%SpeechML;
]>
您可以使用其中一个定义ndash的标准XHTML dtd,例如。
如果tox.dtd确实声明了它,那么你需要一个解析器才能找到它。
答案 1 :(得分:0)