合并xml文档

时间:2011-10-11 13:37:56

标签: c# xml linq recursion linq-to-xml

我遇到的有关合并XML文档的所有解决方案都无法满足我的需求。让我解释一下:

XML文档1:

<?xml version="1.0" encoding="utf-8" ?>
<a>
    <b title="Original Section">
        <b title="Original Child Section"></b>
        <b title="Original Child Section 2"></b>
    </b>
</a>

XML文档2:

<?xml version="1.0" encoding="utf-8" ?>
<a>
    <b title="New Section">
        <b title="New Child Section"></b>
    </b>
    <b title="Original Section">
        <b title="Original Child Section">
            <b title="New Child For Old Section"></b>
        </b>
    </b>    
</a>

进入这样的最终文档:

<?xml version="1.0" encoding="utf-8" ?>
<a>
    <b title="Original Section">
        <b title="Original Child Section">
            <b title="New Child For Old Section"></b>
        </b>
        <b title="Original Child Section 2"></b>
    </b>    
    <b title="New Section">
        <b title="New Child Section"></b>
    </b>
</a>

文档内容相似,但可以有任意数量的子节点。我也想消除重复。我认为重复是具有相同属性的元素(基于属性名称和值)。有谁见过这个实现的工作示例?我可以设想如何使用一些循环和一些递归来编写它,但对我来说,这似乎不是实现我想要的最佳方式:)

提前干杯谢谢!

* 编辑 *

既然共识是循环和递归是必须的,那么最优雅和有效的方法是什么呢?我想这个问题的另一个基本问题是在迭代时比较节点的最佳方法是什么?

2 个答案:

答案 0 :(得分:1)

最终,此问题的任何解决方案都将归结为循环和/或递归。你说的是基本集理论,而linq可能对提炼过程很有用,但最终会迭代两个集合并合并结果。

答案 1 :(得分:1)

我会写一个IEqualityComparer来指定两个节点何时是“匹配” - 即设置标题匹配规则。

class XElementComparer : IEqualityComparer<XElement>
{
    public bool Equals(XElement x, XElement y)
    {
        var xTitle = x.Attribute("title");
        var yTitle = y.Attribute("title");

        if (xTitle == null || yTitle == null) return false;

        return xTitle.Value == yTitle.Value;
    }

    public int GetHashCode(XElement obj)
    {
        return base.GetHashCode();
    }
}

然后编写一个递归方法来遍历XML,合并根据比较器匹配的节点。

private XElement Merge(XElement node1, XElement node2)
{
    // trivial cases
    if (node1 == null) return node2;
    if (node2 == null) return node1;

    var elements1 = node1.Elements();
    var elements2 = node2.Elements();

    // create a merged root
    var result = new XElement(node1.Name, node1.Attribute("title")); 

    var comparer = new XElementComparer();
    var mergedNodes = elements1.Union(elements2, comparer).ToList();

    // for the union of the elements, insert their merge values
    foreach (var title in mergedNodes)
    {
        var child1 = elements1.SingleOrDefault(e => comparer.Equals(e, title));
        var child2 = elements2.SingleOrDefault(e => comparer.Equals(e, title));

        result.Add(Merge(child1, child2));
    }

    return result;
}