我的情况是,我们希望验证在内存中保存为字节流的XML文档,以及在文件系统中放置的XSD。我们希望避免在XML文件中明确提到文件名,而是告诉XML解析器使用一个或多个XSD文件的目录进行验证。
我尝试创建一个DocumentBuilder提供程序(对于Guice 3.0)看起来像:
public class ValidatingDocumentBuilderProvider implements
Provider<DocumentBuilder> {
static final String JAXP_SCHEMA_LANGUAGE = "http://java.sun.com/xml/jaxp/properties/schemaLanguage";
static final String W3C_XML_SCHEMA = "http://www.w3.org/2001/XMLSchema";
static final String JAXP_SCHEMA_SOURCE = "http://java.sun.com/xml/jaxp/properties/schemaSource";
Logger log = getLogger(ValidatingDocumentBuilderProvider.class);
DocumentBuilderFactory dbf;
public synchronized DocumentBuilder get() { // dbf not thread-safe
if (dbf == null) {
log.debug("Setting up DocumentBuilderFactory");
// http://download.oracle.com/javaee/1.4/tutorial/doc/JAXPDOM8.html
dbf = DocumentBuilderFactory.newInstance();
dbf.setNamespaceAware(true);
dbf.setValidating(true);
dbf.setAttribute(JAXP_SCHEMA_LANGUAGE, W3C_XML_SCHEMA);
// parser should look for schema reference in xml file
// Find XSD's in current directory.
FilenameFilter fileNameFilter = new FilenameFilter() {
public boolean accept(File dir, String name) {
return name.toLowerCase().endsWith(".xsd");
}
};
File[] schemaFiles = new File(".").listFiles(fileNameFilter);
dbf.setAttribute(JAXP_SCHEMA_SOURCE, schemaFiles);
log.debug("{} schema files found", schemaFiles.length);
for (File file : schemaFiles) {
log.debug("schema file: {}", file.getAbsolutePath());
}
}
try {
return dbf.newDocumentBuilder();
} catch (ParserConfigurationException e) {
throw new RuntimeException("get DocumentBuilder", e);
}
}
}
(我也尝试过使用文件名)。 Eclipse接受XSD - 当放入目录时,它可以验证这里处理的XML
在尝试验证时,解析器暂时停止显示。这可能是网络查找。
-Djaxp.debug=1
只添加这些行
JAXP: find factoryId =javax.xml.parsers.DocumentBuilderFactory
JAXP: loaded from fallback value: com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl
JAXP: created new instance of class com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl using ClassLoader: null
如何让JDK 6中的解析器告诉我它在做什么?如果我不能这样做,我如何检查其中的XML目录使用情况,看看为什么没有选择提供的XSD?
我忽略了哪些显而易见的事情?
答案 0 :(得分:0)
你说
我们希望避免在XML文件中明确提到文件名
如何解析器能够选择适当的模式?
您可以尝试的是,使用Schema
基于所有可用的架构资源创建SchemaFactory
,并将其附加到文档构建器工厂。然后,解析器将根据此“超级模式”自动验证文档。
如果您的模式集具有内部依赖关系(即import或include),请确保使用相对URL或专门的解析程序正确解析这些引用。
更新:
在仔细阅读了这个http://java.sun.com/j2ee/1.4/docs/tutorial/doc/JAXPDOM8.html之后,我意识到你的方法应该与我的提议具有相同的效果,所以其他的东西就是n。我只能说我描述的内容很有效。