找到两个数字列表的匹配

时间:2013-01-24 11:44:52

标签: c# algorithm

我有两组数字, SET2 通常包含更多项目。保证 SET2 的计数等于或大于 SET1 的计数。 实际上,由于订单很重要,因此输入是列表而非集合。

我的目标是将 SET2 中的数字组合(总结)/重新排序,使其尽可能与 SET1 类似。我将相似度定义为每个位置的偏差之和。有关计算相似度的方式,请参阅this post。总和越小越好。

我的第一个方法是尝试所有组合并选择最好的组合。这仅适用于非常小的集合(尤其是第二个集合)。请参阅this post和罗林的答案。 是否有更聪明的方法来获得良好的组合?我绝对不需要最好的一个。一个好的结果会很好。显然,具有空子集的集合是无意义的。绝对不平衡的集合对我来说似乎不太有希望。 SET1往往有大约8个,但最多可以有18个条目。 SET2通常计数超过10(最多35)。 两组中的数字之和相等(除了舍入误差)。

这是一个结果好坏的例子(并非所有可能的结果):

SET1 = { 272370, 194560, 233430 }; SET2 = { 53407.13, 100000, 365634.03, 181319.07 }

      272370            |      194560          |        233430 
---------------------------------------------------------------------
     365634.03         |  100000 + 53407.13   |      181319.07       (best match)
     365634.03         |     181319.07        |  100000 + 53407.13   (good)
     365634.03         |      100000          |181319.07 + 53407.13  (ok)
      53407.13          |365634.03 + 100000    |      181319.07       (bad)
      53407.13          |365634.03 + 181319.07 |        100000        (bad)
.                 |365634.03 + 181319.07 | 53407.13 + 100000    (invalid)
53407.13 + 100000 |365634.03 + 181319.07 |                      (invalid)

如果我忘了描述前提或我的描述不清楚甚至是错误的,请告诉我。我也很乐意提供另一个例子。

提前致谢!

1 个答案:

答案 0 :(得分:1)

启发式,它应该工作得非常好:

1. list<int> set1, set2;
2. sort(set2) // decreasing, set2[0] would be the greatest value in set2
3. struct set1item = {set1index, value, list<int> chosen}
4. prepare list<set1item> set1items from set1 //(index = index in set1 list, value = set1[index] and chosen = null)
5. put set1items to some priorityqueue pq // ordered by value
6. for each set2item in set2{
7.     item = pq.first()
8.     item.chosen.add(set2item);
9.     item.value -= set2item;
10.    pq.updateFirst(item)
11.}

它的工作方式如下:从set2到最低值迭代,从set1获取实际最高元素,从set2获取元素减去它,并将set2中的元素添加到set1结果中的元素。

您必须记住检查set1中的所有元素是否都没有空结果。

例1: Set1 = {20, 9, 7, 3}, Set2 = {7, 6, 6, 4, 2, 2, 2, 2, 2, 2, 2, 2}

iter1:fromSet2 = 7Set1 = {20:{}, 9:{}, 7:{}, 3:{}}fromSet1=20。 减少20乘以7并将结果加7。更新:Set1 = {13:{7}, 9:{}, 7:{}, 3:{}}

iter2:fromSet2 = 6Set1 = {13:{7}, 9:{}, 7:{}, 3:{}}fromSet1=13。 减少13乘以6并将结果加6。更新:Set1 = {7:{7, 6}, 9:{}, 7:{}, 3:{}}

iter3:fromSet2 = 6Set1 = {7:{7, 6}, 9:{}, 7:{}, 3:{}}fromSet1=9。 减少9乘以6并将结果加6。更新:Set1 = {7:{7, 6}, 3:{6}, 7:{}, 3:{}}

iter4:fromSet2 = 4Set1 = {7:{7, 6}, 3:{6}, 7:{}, 3:{}}fromSet1=7。 减少7乘以4并将结果加4。更新:Set1 = {3:{7, 6, 4}, 3:{6}, 7:{}, 3:{}}

iter5:fromSet2 = 2Set1 = {3:{7, 6, 4}, 3:{6}, 7:{}, 3:{}}fromSet1=7。 减少7乘以2并将结果加2。更新:Set1 = {3:{7, 6, 4}, 3:{6}, 5:{2}, 3:{}}

...