XOM和Canonical XML

时间:2011-06-16 09:58:40

标签: java xml xom

我正在创建一个java应用程序,用于检查XML文件是否已经Canonical使用XOM。

在我的测试中,我有以下文件已经是Canonical。

<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
  <a a1="1" a2="2">123</a>
  <b xmlns:y="http://example.com/y" a3="&quot;3&quot;" y:a1="1" y:a2="2"></b>
</doc>

这是我用XOM再次加载时的代码。

<?xml version="1.0"?>
<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
  <a a1="1" a2="2">123</a>
  <b xmlns:y="http://example.com/y" a3="&quot;3&quot;" y:a1="1" y:a2="2" />
</doc>

如您所见,它会再次添加xml标记并删除结束标记</b>,因为标记b的值为空。 我对xml版本标记没有任何问题,但是当我从文件加载规范文档时,我不知道如何处理结束标记</b>

1 个答案:

答案 0 :(得分:3)

看起来您输出的文档带有XOM Serializer,您需要使用XOM Canonicalizer输出xml文档并将其保留为Canonical

这给出了输出:

<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
    <a a1="1" a2="2">123</a>
    <b a3="&quot;3&quot;" y:a1="1" y:a2="2" xmlns:y="http://example.com/y"/>
</doc>

以下示例程序将使用XOM Canonicalizer

将您的XML Cannonically输出到System.out
package com.foo.bar.xom;

import java.io.IOException;

import nu.xom.Builder;
import nu.xom.canonical.Canonicalizer;
import nu.xom.Document;
import nu.xom.ParsingException;
import nu.xom.Serializer;
import nu.xom.ValidityException;

public class App
{
    public static void main(String[] args) throws ValidityException, ParsingException, IOException
    {
        Builder builder = new Builder();
        //Serializer serializer = new Serializer(System.out);
        Canonicalizer canonicalizer = new Canonicalizer(System.out, Canonicalizer.EXCLUSIVE_XML_CANONICALIZATION);
        //this assumes to your xml document is on the classpath in this package as my.xml
        Document input = builder.build(App.class.getResourceAsStream("my.xml"), null);
        //serializer.write(input);
        canonicalizer.write(input);

    }
}