如何根据本地存储为文件的DTD验证XML文件? XML文件没有任何DOCTYPE声明(或者可能有一个应该被覆盖的声明)。我看了this thread,但除了他们使用.NET之外,我怀疑这是一个很好的解决方案。
任何意见都赞赏!
答案 0 :(得分:25)
在理想的世界中,您可以使用Validator进行验证。像这样:
SchemaFactory schemaFactory = SchemaFactory
.newInstance(XMLConstants.XML_DTD_NS_URI);
Schema schema = schemaFactory.newSchema(new File(
"xmlValidate.dtd"));
Validator validator = schema.newValidator();
validator.validate(new StreamSource("xmlValidate.xml"));
不幸的是,Sun实现(至少从Java 6开始)不包括从DTD创建Schema实例的支持。您可以跟踪第三方实施。
您最好的选择可能是在使用其他机制解析之前更改文档以包含DTD。
您可以使用transformer插入DTD声明:
TransformerFactory tf = TransformerFactory
.newInstance();
Transformer transformer = tf.newTransformer();
transformer.setOutputProperty(
OutputKeys.DOCTYPE_SYSTEM, "xmlValidate.dtd");
transformer.transform(new StreamSource(
"xmlValidate.xml"), new StreamResult(System.out));
...但这似乎并没有取代现有的DTD声明。
此StAX事件阅读器可以完成此任务:
public static class DTDReplacer extends
EventReaderDelegate {
private final XMLEvent dtd;
private boolean sendDtd = false;
public DTDReplacer(XMLEventReader reader, XMLEvent dtd) {
super(reader);
if (dtd.getEventType() != XMLEvent.DTD) {
throw new IllegalArgumentException("" + dtd);
}
this.dtd = dtd;
}
@Override
public XMLEvent nextEvent() throws XMLStreamException {
if (sendDtd) {
sendDtd = false;
return dtd;
}
XMLEvent evt = super.nextEvent();
if (evt.getEventType() == XMLEvent.START_DOCUMENT) {
sendDtd = true;
} else if (evt.getEventType() == XMLEvent.DTD) {
// discard old DTD
return super.nextEvent();
}
return evt;
}
}
它将在文档开始后立即发送给定的DTD声明,并丢弃旧文档中的任何声明。
演示用法:
XMLEventFactory eventFactory = XMLEventFactory.newInstance();
XMLEvent dtd = eventFactory
.createDTD("<!DOCTYPE Employee SYSTEM \"xmlValidate.dtd\">");
XMLInputFactory inFactory = XMLInputFactory.newInstance();
XMLOutputFactory outFactory = XMLOutputFactory.newInstance();
XMLEventReader reader = inFactory
.createXMLEventReader(new StreamSource(
"xmlValidate.xml"));
reader = new DTDReplacer(reader, dtd);
XMLEventWriter writer = outFactory.createXMLEventWriter(System.out);
writer.add(reader);
writer.flush();
// TODO error and proper stream handling
请注意,XMLEventReader可以构成执行验证的其他转换机制的源。
如果您有这个选项,使用W3架构验证要容易得多。
答案 1 :(得分:3)
我很确定前面提到的东西会起作用..
感谢您的帮助,但是如果没有指定DOCTYPE怎么办? 所有?在这种情况下,EntityResolver不会帮助我,不是吗? - Simon Jul 8&09; 09,6:34
@Bluegene:如果没有DOCTYPE,你有什么证据? - J-16 SDiZ 7月8日和09年7月12日
反对我自己的DTD。我只想确保收到的XML 符合我的DTD,而不仅仅是发件人指定的任何DTD。 - 西蒙·朱尔 8&#39; 09在23:09
如果问题是您希望对您的dtd进行验证而不是作者,则应确保有明确的文档详细说明doctype以及xml文件中必须包含的内容
答案 2 :(得分:1)
您必须实施EntityResolver
,结帐this example。