我希望找到最快的方法来找到1000个'n'整数的可能组合来找到目标整数。
例如。说我想要数字'20'。我想找到最多1000个四个整数的组合,它们总和到这个数字。整数可以重复。我还有一个条件,即整数不得小于特定数字,在本例中为4。
target<-20 #the number I wish to sum to
lowest<-4 #the smallest integer I allow
size<-4 #the number of integers I wish to use to sum
maxposs <- target - ((size-1) * lowest) #given the lowest, this is the max possible integer. In my example it is 8.
这就是我开始解决这个问题的方法。使用combn
查找四个选定整数的所有组合,然后按总和到我的目标的那些进行过滤。
m <- combn(rep(lowest:maxposs,size), size)
m1<- m[,colSums(m)==target]
这里,'m1'有245列。只有这么多解决方案。最后几栏:
# [,238] [,239] [,240] [,241] [,242] [,243] [,244] [,245]
#[1,] 4 4 4 4 4 4 5 5
#[2,] 5 5 5 6 7 4 6 4
#[3,] 7 4 5 4 4 5 4 5
#[4,] 4 7 6 6 5 7 5 6
然而,在我的实际应用中,我可以处理非常高的整数(总计高达1000),并希望将自己限制为1000种可能组合的随机样本。由于这是一项随机统计检验,速度至关重要。我想知道是否有人知道更快的方法。我的方式感觉不直观。
答案 0 :(得分:4)
my_matrix <- matrix(nrow = 1000, ncol = 4)
i <- 1
nn <- 1000
while(i <= 1000){
x <- sample(x = 4:nn, size = 3)
y = nn - sum(x)
if(y >= 4){
my_matrix[i, ] <- c(x, y)
i <- i + 1
}
}
Per Gavin的建议,用预先分配的矩阵重做。现在这个运行时间为.158秒,速度提高了两倍,并且可能会更好地扩展。