迭代数据框

时间:2016-04-22 07:55:06

标签: r algorithm dataframe iteration combinatorics

我正在寻找一种迭代数值数据框中所有可能的列和行组合的方法。所以它可能看起来像这样(只有很多可能的组合中的一些):

  • 第一次迭代:A列+第1行
  • 第二次迭代:B列+第1行
  • 第3次迭代:A列+ B列+第1行
  • 第4次迭代:A列+ B列+第1行+第2行
  • 依此类推......

对于列和行的每个组合,应执行简单的数学计算,并将其结果存储到数据帧result。这样我想最终找到产生最高/最低计算结果的列和行的组合。

所以我的代码看起来像这样(关于计算):

calc = sum(sum(colSums(data)) + sum(rowSums(data)) / (nrow(data) * ncol(data)))

所以我的问题是:

  1. 如何在r代码中创建此迭代过程,即尝试所有可能组合的过程?我想过使用两个嵌套的for() - 循环,但我不确定这是否有效(特别是如何在不知道名字和数字的情况下解决列/行)
  2. 如何最终将所有结果存储到单个数据框resultresult应包含计算结果以及列和行的相应组合。
  3. 你有什么想法我能解决这个问题吗?

    以下是一些可以使用的数据:

    data = structure(list(GDP = c(18.2, 8.5, 54.1, 1.4, 2.1, 83.6, 17), 
        Population = c(1.22, 0.06, 0, 0.54, 2.34, 0.74, 1.03), Birth.rate = c(11.56, 
        146.75, 167.23, 7, 7, 7, 10.07), Income = c(54, 94, 37, 95, 
        98, 31, 78), Savings = c(56.73, 56.49, 42.81, 70.98, 88.24, 
        35.16, 46.18)), .Names = c("GDP", "Population", "Birth.rate", 
        "Income", "Savings"), class = "data.frame", row.names = c(NA, 
        -7L))
    

1 个答案:

答案 0 :(得分:1)

我没有完全遵循我们想要实现的目标,也许这是一个开始:

library(data.table)

cc <- 1:ncol(data)
rr <- 1:nrow(data)

rbindlist(
  lapply(cc, function(i){
    ccN <- combn(cc, i)
    rbindlist(
      apply(ccN, 2, function(iN){
        rbindlist(
          lapply(rr, function(j){
            rrN <- combn(rr, j)
            rbindlist(
              apply(rrN, 2, function(jN){
                data.frame(
                  Sum = sum(c(
                    unlist(data[jN, ]),
                    unlist(data[, iN]))),
                  Desc = paste(c("rows",jN,"cols",iN), collapse = ",")
                )
              })
            )
          })
        )
      })
    )
  })
)


#          Sum                              Desc
#   1:  326.61                     rows,1,cols,1
#   2:  490.70                     rows,2,cols,1
#   3:  486.04                     rows,3,cols,1
#   4:  359.82                     rows,4,cols,1
#   5:  382.58                     rows,5,cols,1
#  ---                                          
#3933: 2687.14   rows,1,2,3,5,6,7,cols,1,2,3,4,5
#3934: 2560.92   rows,1,2,4,5,6,7,cols,1,2,3,4,5
#3935: 2556.26   rows,1,3,4,5,6,7,cols,1,2,3,4,5
#3936: 2720.35   rows,2,3,4,5,6,7,cols,1,2,3,4,5
#3937: 2862.06 rows,1,2,3,4,5,6,7,cols,1,2,3,4,5