查找一组值的所有唯一子集

时间:2013-12-16 15:45:31

标签: algorithm set unique subset

我有算法问题。我试图从更大的值集中找到所有唯一的值子集。

例如说我有集{1,3,7,9}。我可以使用什么算法来查找3的这些子集?

{1,3,7}
{1,3,9}
{1,7,9}
{3,7,9}

子集不应重复,且顺序不重要,为了这些目的,set {1,2,3}与set {3,2,1}相同。鼓励Psudocode(或常规类型)。


蛮力方法显然是可行的,但不是所希望的。

例如,这种蛮力方法如下。

for i = 0 to size
  for j = i + 1 to size
    for k = j + 1 to size
      subset[] = {set[i],set[j],set[k]}

不幸的是,这需要为子集中所需的每个元素添加一个额外的循环,例如,如果您想要8个元素的子集,这是不合需要的。

1 个答案:

答案 0 :(得分:4)

一些使用递归的Java代码。

基本思路是尝试将每个元素与当前位置交换,然后递归到下一个位置(但我们还需要startPos来指示我们交换的最后位置是什么,否则我们'我会得到一个简单的排列生成器)。一旦我们有足够的元素,我们打印所有这些并返回。

static void subsets(int[] arr, int pos, int depth, int startPos)
{
   if (pos == depth)
   {
      for (int i = 0; i < depth; i++)
         System.out.print(arr[i] + "  ");
      System.out.println();
      return;
   }
   for (int i = startPos; i < arr.length; i++)
   {
      // optimization - not enough elements left
      if (depth - pos + i > arr.length)
         return;

      // swap pos and i
      int temp = arr[pos];
      arr[pos] = arr[i];
      arr[i] = temp;

      subsets(arr, pos+1, depth, i+1);

      // swap pos and i back - otherwise things just gets messed up
      temp = arr[pos];
      arr[pos] = arr[i];
      arr[i] = temp;
   }
}

public static void main(String[] args)
{
   subsets(new int[]{1,3,7,9}, 0, 3, 0);
}

打印:

1  3  7  
1  3  9  
1  7  9  
3  7  9  

更详细的解释(通过示例):

首先要做的事情 - 在上面的代码中,通过与自身进行交换,元素保持在相同的位置 - 它没有做任何事情,只是使代码更简单。

另请注意,在每一步我们都会恢复所有掉期。

假设我们输入了1 2 3 4 5,我们希望找到大小为3的子集。

首先我们只考虑前3个元素 - 1 2 3

然后我们分别将345交换 前三个元素为我们提供了1 2 41 2 5

请注意,我们刚刚完成了包含12的所有集合。

现在我们需要1 3 X形式的集合,因此我们交换23并获取1 3 2 4 5。但是我们已经有包含12的集合,因此我们要跳过2。因此,我们分别将245交换,前3个元素为我们提供1 3 41 3 5

现在我们将24交换为1 4 3 2 5。但我们想跳过32,因此我们从5开始。我们交换35,前3个元素为我们1 4 5

等等。

在此处跳过元素可能是最复杂的部分。请注意,每当我们跳过元素时,它只涉及在我们交换的位置之后继续(当我们交换24时,我们继续在4之后)。这是正确的,因为元素无法在未经处理的情况下到达我们交换的位置的左侧,处理后的元素也不能到达该位置的右侧,因为我们处理从左到右的所有元素

根据for-loops考虑

从for循环的角度考虑算法可能是最简单的。

for i = 0 to size
  for j = i + 1 to size
    for k = j + 1 to size
      subset[] = {set[i],set[j],set[k]}

每个递归步骤都代表一个for循环。

startPos分别为0i+1j+1

depth是有多少个for循环。

pos是我们目前所处的for循环。

由于我们永远不会在更深的循环中向后移动,因此只要我们在完成迭代时恢复更改,就可以安全地使用数组的开头作为元素的存储。