如何通过DOM在xml文档中插入schemalocation

时间:2011-02-02 11:30:10

标签: dom xsd jaxp

我用JAXP创建一个xml文档,并搜索插入schemalocation的方法。 目前我的申请表:

<?xml version="1.0" encoding="UTF-8"?>
<root>
...
</root>

但我需要:

<?xml version="1.0" encoding="UTF-8"?>
<root xmlns="namespaceURL" 
xmlns:xs="http://www.w3.org/2001/XMLSchema-instance"
xs:schemaLocation="namespaceURL pathToMySchema.xsd">
...
</root>

我的代码:

StreamResult result = new StreamResult(writer);
Document doc = getDocument();

Transformer trans = transfac.newTransformer();
trans.setOutputProperty(OutputKeys.INDENT, "yes");
trans.setOutputProperty(OutputKeys.METHOD, "xml");
trans.setOutputProperty(OutputKeys.VERSION, "1.0");
trans.setOutputProperty(OutputKeys.ENCODING, "UTF-8");

DOMSource source = new DOMSource(depl.getAsElement(doc));
trans.transform(source, result);

感谢您的时间,
卡斯滕

3 个答案:

答案 0 :(得分:6)

在XML数据模型中,命名空间节点实际上并不是从父元素读取的,而是每个元素都有自己的命名空间节点。因此,简单地向根元素添加新的默认命名空间不起作用,但会产生类似这样的文档

<root xmlns="namespaceURL">
    <child xmlns=""/>
    ...
</root>

注意在子元素上出现空的默认命名空间xmlns=""。实际需要做的是修改每个节点的命名空间或创建具有所需默认命名空间的新文档,并将旧文档的内容,元素和属性名称等复制到新文档。这些可以通过递归遍历原始文档来完成。我听说,使用Java DOM实现这很费力。一个捷径可能是使用名称空间不知道的DOM读取文档,然后将新的默认名称空间添加为属性。其他解决方案是使用XSLT转换来更改命名空间,这在这种情况下似乎非常合适,因为您实际上已经通过XSLT转换生成输出。

使用此XSLT样式表将新的默认命名空间和架构位置添加到根元素。此样式表保留旧命名空间,但如果它们之前位于非命名空间中,则将所有元素添加到新的默认命名空间。

<xsl:stylesheet
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  version="1.0">

    <!-- Template to add a default namespace to a document -->
    <!-- Elements without a namespace are "moved" to default namespace -->
    <!-- Elements with a namespace are copied as such -->

  <!-- string for default namespace uri and schema location -->
  <xsl:variable name="ns" select="'namespaceURL'"/>
  <xsl:variable name="schemaLoc" select="'namespaceURL pathToMySchema.xsd'"/>

    <!-- template for root element -->
    <!-- adds default namespace and schema location -->
  <xsl:template match="/*" priority="1">
    <xsl:element name="{local-name()}" namespace="{$ns}">
      <xsl:attribute name="xsi:schemaLocation"
        namespace="http://www.w3.org/2001/XMLSchema-instance">
        <xsl:value-of select="$schemaLoc"/>
        </xsl:attribute>
      <xsl:apply-templates select="@* | node()"/>
    </xsl:element>
  </xsl:template>

    <!--template for elements without a namespace -->
  <xsl:template match="*[namespace-uri() = '']">
    <xsl:element name="{local-name()}" namespace="{$ns}">
      <xsl:apply-templates select="@* | node()"/>
    </xsl:element>
  </xsl:template>

    <!--template for elements with a namespace -->
  <xsl:template match="*[not(namespace-uri() = '')]">
    <xsl:copy>
      <xsl:apply-templates select="@* | node()"/>
    </xsl:copy>
  </xsl:template>

    <!--template to copy attributes, text, PIs and comments -->
  <xsl:template match="@* | node()">
    <xsl:copy>
      <xsl:apply-templates select="@* | node()"/>
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>

而不是使用

创建变换器
Transformer trans = transfac.newTransformer();

(创建和进行身份转换的样式表),创建一个XSLT输入源并将其作为参数提供给newTransformer()

javax.xml.transform.Source xsltSource = new javax.xml.transform.stream.StreamSource(xsltFile);
Transformer trans = transFact.newTransformer(xsltSource);

其中xsltFile是指向该XSLT文件的File对象。

根据需要设置输出属性,并在示例代码中调用transform()。结果应该符合您的要求,但我未在Java中对此进行测试。给定的XSLT文件测试了一些简单的案例,并且在这个答案的末尾有一个示例输入和输出。

一些小调:

  1. 在此过程中不会修改原始文档对象。新的默认命名空间仅出现在transform()方法的输出中。
  2. 架构实例名称空间的名称空间前缀通常为xsi:,而不是xs:,如示例代码中所示(xs:用于架构定义(以及xsd: ))。

  3. 上面显示的XSLT样式表的示例输入和输出

    输入:

    <root>
        <child>text</child>
        <child attribute="attr-value"/>
        <?pi-target pi-content?>
        <nsx:ns-child xmlns:nsx="ns1x">
            <no-ns-child>text</no-ns-child>
            <!-- comment -->
            <nsx:ns-child nsx:ns-attribute="nsx-attr-value">text</nsx:ns-child>
        </nsx:ns-child>
        <defns-child xmlns="default-ns">
            <def-child attr="val">text</def-child>
            <child xmlns=""/>
        </defns-child>
        <child>text</child>
    </root>
    

    输出:

    <?xml version="1.0" encoding="UTF-8"?>
    <root xmlns="namespaceURL" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="namespaceURL pathToMySchema.xsd">
        <child>text</child>
        <child attribute="attr-value"/>
        <?pi-target pi-content?>
        <nsx:ns-child xmlns:nsx="ns1x">
            <no-ns-child>text</no-ns-child>
            <!-- comment -->
            <nsx:ns-child nsx:ns-attribute="nsx-attr-value">text</nsx:ns-child>
        </nsx:ns-child>
        <defns-child xmlns="default-ns">
            <def-child attr="val">text</def-child>
            <child xmlns="namespaceURL"/>
        </defns-child>
        <child>text</child>
    </root>
    

答案 1 :(得分:4)

您可以在创建文档时在根目录中添加名称空间。

String NS_URL = "namespaceURL";

doc = builder.newDocument();
Element root = doc.createElementNS(NS_URL, "root");
root.setAttributeNS("http://www.w3.org/2001/XMLSchema-instance", 
    "xs:schemaLocation", NS_URL + " pathToMySchema.xsd");
doc.appendChild(root);

然后,对于添加到doc而不是createElement()的每个元素,请使用createElementNS()

doc.createElementNS(NS_URL, name);

这会产生你想要的东西。

<root 
    xmlns="namespaceURL"
    xmlns:xs="http://www.w3.org/2001/XMLSchema-instance" 
    xs:schemaLocation="namespaceURL pathToMySchema.xsd"
    >

答案 2 :(得分:1)

以下是如何给解析器提示以解决您的问题: http://bytes.com/topic/java/answers/16892-xerces-how-perfrom-schema-validations-without-using-xsi-schemalocation

它是这样的:

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
dbf.setNamespaceAware(true);
dbf.setValidating(true);
dbf.setAttribute("http://java.sun.com/xml/jaxp/properties/schemaLanguage",
"http://www.w3.org/2001/XMLSchema");
dbf.setAttribute("http://java.sun.com/xml/jaxp/properties/schemaLocation",
"http://www.example.com/Report.xsd");

这是一个包含一些源代码的验证示例。它可能对你有帮助。 http://www.ibm.com/developerworks/xml/library/x-tipvalschm/

(如果情况变得更糟,你总是可以搜索和替换。我知道它不是理想的解决方案,但是javax.xml.transform.OutputKeys似乎没有与schemalocation属性相关的成员。)