用于计算无限数量集的所有相交和分离的算法

时间:2013-09-02 08:24:53

标签: algorithm set

最近我不得不针对下面列出的设置问题开发一个简单的递归算法,但现在想知道问题的形式描述/名称是什么,以及是否有一种算法可以更有效地解决问题(我怀疑有)。

我知道有不同的算法可以找到相交和脱离,但我还没有认识到任何覆盖这个问题的整体。

问题:

获取无限数量的集合,并为所有集合的每个交叉和非交叉返回一个集合。

例如,给定4组作为输入A,B,C,D:

A {1,14,2,10,13,12,8,9}

B {2,3,4,15,11,13,9}

C {13,10,4,15,5,6,12,11}

D {7,8,9,13,11,6,12}

enter image description here

结果应该是以下13套:

{1,14},{2},{3},{4,15},{5},{6},{7},{8},{9},{10},{11} {12},{13}

enter image description here

我开发的算法是天真的,因为它以递归方式比较了所有设置排列(我希望能够在XSLT 2.0中相对容易地实现它),直到找不到更多的交集。

在某些上下文中,我需要执行此操作来描述树的多个版本如何在树上的每个点修改原始树。 “树”实际上是一个XML文档。

[更新] 在3组中显示接受的答案中的第一个算法: {1,2,3},{2,3,4},{2,3,5}

enter image description here

与我原来的nieve算法相比,运行了3套:

enter image description here

1 个答案:

答案 0 :(得分:1)

一旦设置属性明确,问题就变得非常容易了。

A int B int C = ( A int B ) int C

这告诉我们的是,我们可以解决2组的问题,然后将每个结果与第三组相交,依此类推。

通过解决问题,我的意思是,A int B生成3组:

A op B => A int B , A - (A int B) , B - (A int B)

一旦清楚,实施就变得简单了,应该看起来像:

resultset = emptyset
while ( queue not empty )
   tmpset = emptyset
   A = queue.pop()
   residual = A
   for B in resultset
     tmpset = tmpset + {A int B , B - (A int B)}
     residual = residual - B
   tmpset = tempset + residual
   resultset = tmpset

显然,如果任何一个集合为空,则不需要将其添加到解决方案中。 这是一些使用字典思想解决问题的C#代码:

        var query = arr.Select((x, i) => x.Select(y => new { Elem = y, Index = i }))
            .SelectMany(x => x)
            .GroupBy(x => x.Elem)
            .ToDictionary(x => x.Key, y => new HashSet<int>(y.Select(z => z.Index).ToList()))
            .GroupBy(x => x.Value, HashSet<int>.CreateSetComparer())
            .Select(x=>x.Select(y=>y.Key).ToList())
            .ToList();