我遵循了Obtaining DOCTYPE details using SAX (JDK 7),是这样实现的:
public class MyXmlReader {
public static void parse(InputSource inputSource) {
try {
XMLReader xmlReader = XMLReaderFactory.createXMLReader();
MyContentHandler handler = new MyContentHandler();
xmlReader.setContentHandler(handler);
xmlReader.setProperty("http://xml.org/sax/properties/lexical-handler", handler); // Does not work; handler is set, but startDTD/endDTD is not called
xmlReader.setDTDHandler(handler);
xmlReader.setErrorHandler(new MyErrorHandler());
xmlReader.setFeature("http://xml.org/sax/features/validation", false);
xmlReader.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
xmlReader.parse(inputSource);
}
catch (SAXException e) {
throw new MyImportException("Error while parsing file", e);
}
}
}
MyContentHandler扩展了DefaultHandler2,但既未调用startDTD也未调用endDTD(但是实际上调用了startEntity,因此设置了词法处理程序)。 我尝试不使用这些功能,但这并没有改变。
这里出了什么问题? 我正在使用Java 8 JDK 1.8.0_144。
XML看起来像这样:
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE MyMessage SYSTEM "http://www.testsite.org/mymessage/5.1/reference/international.dtd">
<MyMessage>
<Header>
...
答案 0 :(得分:1)
根据XMLReader API,您需要设置DTD处理程序,否则DTD事件将被静默忽略。 DefaultHandler2
还实现了DTDHandler接口,因此您可以再次使用xmlReader.setDTDHandler(handler);
;