我的问题源于生成一个非常大的素数列表的唯一组合选择5,但我需要返回组合,以便首先返回具有最小总和的组合。 python itertools.combinations()
函数返回数字,增加最后一个,直到它到达可迭代对象的末尾,然后增加下一个,等等。这不适合我的项目,因为总和将继续增加,直到它到达我的素数组的最后一个元素,此时总和将再次下降。
例如,如果我有一小组素数{2,3,5,7,11,13,17,19,23,29}
,我需要按此顺序返回组合:
(2, 3, 5, 7, 11) sum = 28
(2, 3, 5, 7, 13) sum = 30
(2, 3, 5, 7, 17) sum = 34
(2, 3, 5, 11, 13) sum = 34
(2, 3, 5, 7, 19) sum = 36
(2, 3, 7, 11, 13) sum = 36
(2, 3, 5, 11, 17) sum = 38
(2, 5, 7, 11, 13) sum = 38
(3, 5, 7, 11, 13) sum = 39
(2, 3, 5, 7, 23) sum = 40
(2, 3, 5, 11, 19) sum = 40
(2, 3, 5, 13, 17) sum = 40
(2, 3, 7, 11, 17) sum = 40
(2, 3, 5, 13, 19) sum = 42
(2, 3, 7, 11, 19) sum = 42
(2, 3, 7, 13, 17) sum = 42
(2, 5, 7, 11, 17) sum = 42
...
具有相同总和的两个集合的顺序无关紧要,只要具有较大总和的集合在具有较小总和的集合之前不被生成器返回。我正在使用的素数组包含大约100,000个元素,这意味着简单地生成所有组合并对它们进行排序是非常不可行的,因为它需要空间为83,325,000,291,662,500,020,000个元组,每个5个整数。此外,返回的组合元组中的每个元素必须是唯一的;没有重复的整数。有什么想法吗?
答案 0 :(得分:2)
不是生成组合并对它们求和,而是反过来尝试 - 给定一系列总和,为每个总和生成组合:
# some primes for tesing
primes = [2]
x = 3
while x < 100000:
if all(x % p for p in primes):
primes.append(x)
x += 2
# main code
def find(tsum, tlen):
def _find(tsum, tlen, path, idx):
if tlen <= 0:
if tsum == 0:
yield path
return
while True:
p = primes[idx]
if p > tsum:
return
for f in _find(tsum - p, tlen - 1, path + [p], idx + 1):
yield f
idx += 1
return _find(tsum, tlen, [], 0)
for s in range(1001, 1002): # just for testing, should be range(28, max possible sum)
for comb in find(s, 5):
print s, comb
这在性能方面远非理想,但在我的机器上仍然非常快。
答案 1 :(得分:1)
我不确定这需要多少空间,所以最好先用一小部分素数来尝试。
有一个数组/素数列表,按升序排序。
保留index-quintuples的优先级队列,其中相应素数的总和为key / weight / priority / whaddayacallit,最初填充权重为(0,1,2,3,4)
的五元组2+3+5+7+11 = 28
。
队列不为空时
(a, b, c, d, e, f)
(当然,将其删除)。将其直接后继者插入队列,后继者是
的后继者(a+1,b,c,d,e)
(a,b+1,c,d,e)
(a,b,c+1,d,e)
(a,b,c,d+1,e)
(a,b,c,d,e+1)
严格上升,最后一个成分小于主要列表的长度
答案 2 :(得分:1)
如果它可以帮助你,这里有一个C程序,几乎以最小的总和生成整数组合。整数必须按升序给出。此程序继承自this post中的其他程序:
#include <stdio.h>
#include <stdlib.h>
int v[100], stack[100];
int sp,i,j,k,n,g,s;
int main()
{
printf("Dimension of V:");
scanf( "%d",&n);
//Input numbers
for (i=0 ; i<n ; i++) {
printf("V[%d]=",i);
scanf( "%d",&g);
v[i]=g;
}
printf("subset number:");
scanf( "%d",&k);
printf("running...\n");
j=0;
s=0;
sp=-1;
while(1) {
// stack ones until stack overflow
while(sp<n-1 && j<k && n-sp>k-j) {
j=j+1;
sp=sp+1;
stack[sp]=1;
s=s+v[sp];
if(j==k) {
for (i=0 ; i<=sp ; i++) if (stack[i]==1) printf("%2d ",v[i]);
printf("sum=%d\n",s);
}
}
// unstack all the zeros until top of stack is equal one
while (stack[sp]==0 && sp>=0) sp=sp-1;
// if Bottom of stack is reached then stop
if (sp<0) break;
// set top of stack from one to zero
stack[sp]=0;
s=s-v[sp];
j=j-1;
}
return 0;
}