想象一下你有一个XML文档并且想象你有DTD但文档本身并没有实际指定DOCTYPE
...你如何插入DOCTYPE
声明,最好是通过指定它解析器(类似于如何为将要解析的文档设置模式)或通过XMLFilter
等插入必要的SAX事件?
我发现了许多对EntityResolver
的引用,但这是在解析期间DOCTYPE
找到时调用的内容,它用于指向本地DTD文件。 EntityResolver2
似乎有我正在寻找的东西,但我没有找到任何使用示例。
这是我到目前为止最接近的:(代码是Groovy,但足够接近你应该能够理解它......)
import org.xml.sax.*
import org.xml.sax.ext.*
import org.xml.sax.helpers.*
class XmlFilter extends XMLFilterImpl {
public XmlFilter( XMLReader reader ) { super(reader) }
@Override public void startDocument() {
super.startDocument()
super.resolveEntity( null,
'file:///./entity.dtd')
println "filter startDocument"
}
}
class MyHandler extends DefaultHandler2 {
public InputSource resolveEntity(String name, String publicId, String baseURI, String systemId) {
println "entity: $name, $publicId, $baseURI, $systemId"
return new InputSource(new StringReader('<!ENTITY asdf "¡">'))
}
}
def handler = new MyHandler()
def parser = XMLReaderFactory.createXMLReader()
parser.setFeature 'http://xml.org/sax/features/use-entity-resolver2', true
def filter = new XmlFilter( parser )
filter.setContentHandler( handler )
filter.setEntityResolver( handler )
filter.parse( new InputSource(new StringReader('''<?xml version="1.0" ?>
<test>one &asdf; two! ¡£¢</test>''')) );
我看到resolveEntity
被召唤但仍然被击中
org.xml.sax.SAXParseException:引用了实体“asdf”,但没有声明。
在com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(AbstractSAXParser.java:1231)
在org.xml.sax.helpers.XMLFilterImpl.parse(XMLFilterImpl.java:333)
我想这是因为没有办法添加解析器知道的SAX事件,我只能通过解析器上游的过滤器添加事件,这些过滤器传递给ContentHandler。因此,文档必须有效进入XMLReader。有什么方法吗?我知道我可以修改原始流以添加doctype或者可以进行转换以设置DTD ...还有其他选项吗?
答案 0 :(得分:1)
我会使用xslt样式表进行身份转换,并使用xsl:output
元素和doctype-system
属性(如果我想添加公共标识符,则使用doctype-public
)。
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output doctype-system="test.dtd"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="node()|@*"/>
</xsl:copy>
</xsl:template>
</xsl:stylesheet>
答案 1 :(得分:1)
您可以尝试按照建议修改原始流的DoctypeChanger:
DoctypeChanger是一个Java类,它允许您在将字符流输入XML解析器时添加,修改或删除字节流中的DOCTYPE声明。
InputStream in = ... // get your XML InputStream
DOCTYPEChangerStream changer = new DOCTYPEChangerStream(in);
changer.setGenerator(
new DoctypeGenerator() {
public Doctype generate(Doctype old) {
return new DoctypeImpl("rootElement", "pubId", "sysId", "internalSubset");
}
}
);
// .. and pass it on to the parser.