如何根据向量长度向data.frame添加列

时间:2017-04-06 09:27:43

标签: r for-loop vector dataframe

我有一个函数runBootstrap,其输出result是一个可变长度的向量(取决于cat的值,它本身是test的乘积) 。抱歉这不是“最小”。

require(dplyr)

test <- function(combo) {
  if(combo[1] == 4) {
    cat <- 4
  } else if((combo[1] == 3 & combo[2] == 2) | (combo[1] == 2 & combo[2]     == 2)) {
    cat <- 3
  } else if((combo[1] == 2 & combo[2] == 1) | (combo[1] == 1 & combo[2]     == 2)) {
    cat <- 2
  } else {
    cat <- 1
  }
}

arg1.freqs <- c(0.5, 0.2, 0.1, 0.1)
arg2.freqs <- c(0.8, 0.2)

runBootstrap <- function(arg1.freqs, arg2.freqs) {
  sim.df <- data.frame(x1 = 1:10000, y1 = NA)
  sim.df$x1 <- sample(1:4, 10000, replace = TRUE,   
                      prob = arg1.freqs)          
  sim.df$y1 <- sample(1:2, 10000, replace = TRUE,
                      prob = arg2.freqs)
  sim.df$cat <- NA
  for(i in 1:nrow(sim.df)) {
    combo <- c(sim.df[i, 1], sim.df[i, 2])
    sim.df$cat[i] <- test(combo)
  }
  sim.df <- sim.df %>%
    select(cat) %>%
    group_by(cat) %>%
    summarise(n = n()) %>%
    mutate(freq = n / sum(n))
  sim.df <- as.data.frame(sim.df)
  result <- c(sim.df[1, 3], sim.df[2, 3])
}

在当前版本中,cat只有两个值,因此result是长度为2的向量;在将来的版本中,我会调整代码,以便length(result)等于cat的#值。

在for循环中使用该函数时,我想使用向量值在已存在的data.frame df1中创建新列。我到目前为止尝试的代码如下:

df1$result <- NA
for (i in 1:nrow(df1)) {
  df1$result[i] <- runBootstrap(arg1.freqs, arg2.freqs)
}

除非结果向量是length = 1,否则这显然不起作用。但是在函数运行之前我不知道向量的长度(尽管一旦运行它,每次迭代的长度都相同)。

我想要实现的目标如下:

示例1:if length(result)== 2

  df1.col x1 x2
1       1  1  1
2       2  2  2
3       3  3  3
4       4  4  4
5       5  5  5
6       6  6  6

示例2:if length(result)== 3

  df1.col x1 x2 x3
1       1  1  1  1
2       2  2  2  2
3       3  3  3  3
4       4  4  4  4
5       5  5  5  5
6       6  6  6  6

感谢您的任何建议或指示。

  • 编辑以供澄清
  • 更新 - 使用解决方案进行编辑

我按照我想要的方式创建了一个空白列表,填充,然后使用rbind,如下所示:

appendResults <- function(df1, arg1, arg2) {
  my.list <- vector("list", nrow(df1))
  for (i in 1:nrow(df1)) {    
    arg1.freqs <- as.numeric(arg1[i, 3:6])
    arg2.freqs <- as.numeric(arg2[i, 3:4])
    my.list[[i]] <- runBootstrap(arg1.freqs, arg2.freqs) 
  }
  result.df <- do.call(rbind, my.list)
  df2 <- do.call(cbind, list(df1, result.df))
}

1 个答案:

答案 0 :(得分:0)

检查一下,不确定结果是什么样的,但是这会创建空列,等于结果的长度,使用NA:

# fake data frame
df1 <- data.frame(x = c(1,2,3), y = c("a", "b", "c"))

# say result has length 3
res <- c(5,6,7)

# make columns with names x1, ..., x + length of res
# and assign NA values to those column
df1[ , paste("x", 1:length(res), sep = "")] <- NA