JAXP - 调试XSD目录查找

时间:2011-10-03 08:02:17

标签: java xml validation jaxp

我的情况是,我们希望验证在内存中保存为字节流的XML文档,以及在文件系统中放置的XSD。我们希望避免在XML文件中明确提到文件名,而是告诉XML解析器使用一个或多个XSD文件的目录进行验证。

我尝试创建一个DocumentBuilder提供程序(对于Guice 3.0)看起来像:

public class ValidatingDocumentBuilderProvider implements
        Provider<DocumentBuilder> {

    static final String JAXP_SCHEMA_LANGUAGE = "http://java.sun.com/xml/jaxp/properties/schemaLanguage";
    static final String W3C_XML_SCHEMA = "http://www.w3.org/2001/XMLSchema";
    static final String JAXP_SCHEMA_SOURCE = "http://java.sun.com/xml/jaxp/properties/schemaSource";

    Logger log = getLogger(ValidatingDocumentBuilderProvider.class);

    DocumentBuilderFactory dbf;

    public synchronized DocumentBuilder get() { // dbf not thread-safe

        if (dbf == null) {
            log.debug("Setting up DocumentBuilderFactory");

            // http://download.oracle.com/javaee/1.4/tutorial/doc/JAXPDOM8.html
            dbf = DocumentBuilderFactory.newInstance();
            dbf.setNamespaceAware(true);
            dbf.setValidating(true);
            dbf.setAttribute(JAXP_SCHEMA_LANGUAGE, W3C_XML_SCHEMA);
            // parser should look for schema reference in xml file

            // Find XSD's in current directory.

            FilenameFilter fileNameFilter = new FilenameFilter() {

                public boolean accept(File dir, String name) {
                    return name.toLowerCase().endsWith(".xsd");
                }
            };
            File[] schemaFiles = new File(".").listFiles(fileNameFilter);

            dbf.setAttribute(JAXP_SCHEMA_SOURCE, schemaFiles);

            log.debug("{} schema files found", schemaFiles.length);
            for (File file : schemaFiles) {
                log.debug("schema file: {}", file.getAbsolutePath());
            }

        }

        try {
            return dbf.newDocumentBuilder();
        } catch (ParserConfigurationException e) {
            throw new RuntimeException("get DocumentBuilder", e);
        }
    }
}

(我也尝试过使用文件名)。 Eclipse接受XSD - 当放入目录时,它可以验证这里处理的XML

在尝试验证时,解析器暂时停止显示。这可能是网络查找。

-Djaxp.debug=1只添加这些行

JAXP: find factoryId =javax.xml.parsers.DocumentBuilderFactory
JAXP: loaded from fallback value: com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl
JAXP: created new instance of class com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl using ClassLoader: null

如何让JDK 6中的解析器告诉我它在做什么?如果我不能这样做,我如何检查其中的XML目录使用情况,看看为什么没有选择提供的XSD?

我忽略了哪些显而易见的事情?

1 个答案:

答案 0 :(得分:0)

你说

  

我们希望避免在XML文件中明确提到文件名

如何解析器能够选择适当的模式?

您可以尝试的是,使用Schema基于所有可用的架构资源创建SchemaFactory,并将其附加到文档构建器工厂。然后,解析器将根据此“超级模式”自动验证文档。

如果您的模式集具有内部依赖关系(即import或include),请确保使用相对URL或专门的解析程序正确解析这些引用。

更新:

在仔细阅读了这个http://java.sun.com/j2ee/1.4/docs/tutorial/doc/JAXPDOM8.html之后,我意识到你的方法应该与我的提议具有相同的效果,所以其他的东西就是n。我只能说我描述的内容很有效。