如何使用Java DOM克隆整个文档?

时间:2008-11-10 21:01:51

标签: java xml dom

我正在寻找一种可靠的,与实现无关的克隆整个文档的方法。 Javadocs特别指出,在Document上调用cloneNode是特定于实现的。我已经尝试通过无操作的Transformer传递Document,但生成的Node没有所有者Document。

我可以创建一个新文档并从旧文档中导入节点,但我担心可能会丢失一些文档元数据。将Document写入字符串并将其解析回来也是如此。

有什么想法吗?

顺便说一下,由于我无法控制的原因,我陷入了Java 1.4.2。

2 个答案:

答案 0 :(得分:7)

正如一些评论指出的那样,序列化和重新解析文档存在问题。除了内存使用,性能考虑和规范化之外,还会丢失prolog(DTD或模式),可能丢失注释(不需要捕获)以及丢失可能重要的空白。应该避免序列化。

如果真正的目标是制作现有DOM Document对象的副本,那么应该在内存中以编程方式处理它。幸运的是,有一种相对简单的方法可以使用Java 5中提供的功能或使用外部XSLT库(如Xalan)来实现此目的,这是一种传递转换。

下面显示了Java 5解决方案:

TransformerFactory tfactory = TransformerFactory.newInstance();
Transformer tx   = tfactory.newTransformer();
DOMSource source = new DOMSource(doc);
DOMResult result = new DOMResult();
tx.transform(source,result);
return (Document)result.getNode();

基本上就是这样。您需要处理异常并且可能希望配置变换器,但我将其留作读者练习。

答案 1 :(得分:2)

然而,quick'n'dirty方法怎么样:将整个Document序列化为XML字符串,然后使用DOM Parser将其解析回来?

我没有看到序列化版本缺少任何东西的原因。介意提供一个例子?

内存消耗量很大,但另一方面,如果你复制整个DOM,那么无论如何它都不会很小......