在R中查找具有约束的值的组合

时间:2018-11-26 05:58:11

标签: r loops recursion constraints tree-traversal

我在向量中有一组值,例如

all_points <- c(1, 4, 2, 12, 6, 5, 25)

我想找到所有可能的组合,其中数字从左到右按升序排列。第一个和最后一个数字将始终包含在内。例如,在这种情况下,它们将是:

1, 4, 12, 25
1, 4, 6, 25
1, 4, 25
1, 2, 12, 25
1, 2, 6, 25
1, 2, 5, 25
1, 2, 25
1, 12, 25
1, 6, 25
1, 5, 25
1, 25

此刻,我正在尝试实现一个递归函数,该函数测试所有向右值的大小,并返回向量列表,但是它不起作用。下面包括R部分代码和伪代码部分,以说明我的方法。

my_recursive_function <- function(input_points, running_vector = c(1)){
    start_point <- input_points[1]
    rightward_points <- input_points[2:length(input_points)
    for(i in 1:length(rightward_points)){
        if(rightward_points[i] != 25 & rightward_points[i] > start_point){
            set_of_points <- c(running_vector, rightward_points[i])
            my_recursive_function(rightward_points, set_of_points)
        }
        if(rightward_points[i] == 25){
            print(c(running_vector, 25)
            flush.console()
            #I will end up doing more than printing here, but this is enough for the example
        }

        #do something to return to the previous level of recursion, 
        #including returning running_vector and rightward_points
        #to the appropriate states
    }

所以希望这种说法有意义。我有两个问题:

  1. 我使这个问题变得过于复杂了,还有更好的方法吗?这是一种遍历树结构的搜索算法,因此在这里我可能会做一些我看不见的聪明事情。
  2. 如果这是 最好的方法,我该怎么做底部的伪代码位?我是 试图弄清楚每个向量的外观变得非常困惑 例如,在每个递归级别中,以及如何从我的弹出菜单中弹出元素 running_vector。

2 个答案:

答案 0 :(得分:2)

一种可能的方法是使用具有不同长度的combn来创建所有可能的组合,如下所示:

combis <- lapply(0L:(length(all_points)-2L), 
            function(n) combn(
                seq_along(all_points)[c(-1L, -length(all_points))], 
                n, 
                function(x) all_points[x],
                FALSE))

lapply(unlist(combis, recursive=FALSE),
    function(x) c(all_points[1L], x, all_points[length(all_points)]))

说明

1)代码的第一行使用第一个元素与最后一个元素之间的元素数(n),并生成所有可能的索引组合,然后使用function(x) all_points[x]

提取相应的元素

2)unlist(..., recursive=FALSE)将列表嵌套1级。

3)lapply(..., function(x) c(sorted[1L], x, sorted[length(sorted)]))将第一个和最后一个元素附加到每个组合

输出

[[1]]
[1]  1 25

[[2]]
[1]  1  4 25

[[3]]
[1]  1  2 25

[[4]]
[1]  1 12 25

[[5]]
[1]  1  6 25

[[6]]
[1]  1  5 25

[[7]]
[1]  1  4  2 25

[[8]]
[1]  1  4 12 25

[[9]]
[1]  1  4  6 25

[[10]]
[1]  1  4  5 25

[[11]]
[1]  1  2 12 25

[[12]]
[1]  1  2  6 25

[[13]]
[1]  1  2  5 25

[[14]]
[1]  1 12  6 25

[[15]]
[1]  1 12  5 25

[[16]]
[1]  1  6  5 25

[[17]]
[1]  1  4  2 12 25

[[18]]
[1]  1  4  2  6 25

[[19]]
[1]  1  4  2  5 25

[[20]]
[1]  1  4 12  6 25

[[21]]
[1]  1  4 12  5 25

[[22]]
[1]  1  4  6  5 25

[[23]]
[1]  1  2 12  6 25

[[24]]
[1]  1  2 12  5 25

[[25]]
[1]  1  2  6  5 25

[[26]]
[1]  1 12  6  5 25

[[27]]
[1]  1  4  2 12  6 25

[[28]]
[1]  1  4  2 12  5 25

[[29]]
[1]  1  4  2  6  5 25

[[30]]
[1]  1  4 12  6  5 25

[[31]]
[1]  1  2 12  6  5 25

[[32]]
[1]  1  4  2 12  6  5 25

答案 1 :(得分:1)

这是一个非递归函数。输出是一个矩阵列表,每个矩阵都有对应于所需向量的列。

non_recursive_function <- function(X){
  N <- length(X)
  X2 <- X[-c(1, N)]
  res <- lapply(seq_along(X2), function(k) t(combn(X2, k)))
  inx <- lapply(res, function(x){
    apply(x, 1, function(y) all(diff(y) > 0))
  })
  res <- lapply(seq_along(res), function(i) res[[i]][inx[[i]], ])
  res <- res[sapply(res, length) > 0]
  res <- lapply(res, function(x) 
    apply(as.matrix(x), 1, function(y) c(X[1], y, X[N])))
  res
}

all_points <- c(1, 4, 2, 12, 6, 5, 25)
x <- non_recursive_function(all_points)