SAX解析器不调用startDTD

时间:2018-09-18 08:51:49

标签: java sax doctype

我遵循了Obtaining DOCTYPE details using SAX (JDK 7),是这样实现的:

public class MyXmlReader {

    public static void parse(InputSource inputSource) {
        try {
            XMLReader xmlReader = XMLReaderFactory.createXMLReader();

            MyContentHandler handler = new MyContentHandler(); 
            xmlReader.setContentHandler(handler);
            xmlReader.setProperty("http://xml.org/sax/properties/lexical-handler", handler);    // Does not work; handler is set, but startDTD/endDTD is not called
            xmlReader.setDTDHandler(handler);
            xmlReader.setErrorHandler(new MyErrorHandler());
            xmlReader.setFeature("http://xml.org/sax/features/validation", false);
            xmlReader.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
            xmlReader.parse(inputSource);
        }
        catch (SAXException e) {
            throw new MyImportException("Error while parsing file", e);
        }
    }
}

MyContentHandler扩展了DefaultHandler2,但既未调用startDTD也未调用endDTD(但是实际上调用了startEntity,因此设置了词法处理程序)。 我尝试不使用这些功能,但这并没有改变。

这里出了什么问题? 我正在使用Java 8 JDK 1.8.0_144。

XML看起来像这样:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE MyMessage SYSTEM "http://www.testsite.org/mymessage/5.1/reference/international.dtd">
<MyMessage>
    <Header>
    ...

1 个答案:

答案 0 :(得分:1)

根据XMLReader API,您需要设置DTD处理程序,否则DTD事件将被静默忽略。 DefaultHandler2还实现了DTDHandler接口,因此您可以再次使用xmlReader.setDTDHandler(handler);