Sapply数据框列分配

时间:2018-03-23 20:21:18

标签: r dataframe apply assign sapply

我想重写this question中的一些第一行,但我无法弄清楚为什么我的sapply行无效。

我想转过这些界限:

cols <- sample(c(1:5), 1)
label <- rep(paste0("label ", seq(from=1, to=10)))
mydata <- data.frame(label)
for (i in 1:cols) {mydata[,i+1] <- sample(c(1:10), 10)}

成:

cols <- sample(c(1:5), 1) 
mydata <- data.frame(rep(paste0("label ", seq(1,10))))
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10) } )

但由于某种原因sapply行给出了new columns would leave holes after existing columns错误,我不知道原因。

我也试过

sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10); mydata } )
Map(function(x, mydata1) {mydata1[,(x+1)] <- sample(c(1:10), 10)}, x = 1:cols, mydata1 = mydata)

2 个答案:

答案 0 :(得分:1)

修改

mydata数据框中分配新列时,它会在函数本地执行。对mydata数据框的任何更改都不适用于此函数的父环境。

要查看此效果,请在函数内使用print语句。

mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
sapply( 1:cols, function(x) { 
  mydata[[(x+1)]] <- sample(c(1:10), 10)
  print(mydata)
  } )
mydata

要防止出现此范围问题,您可以使用<<-代替<-

sapply(1:cols, function(x) { mydata[,(x+1)] <<- sample(c(1:10), 10) } )

注意:强烈建议不要使用<<-方法,因为当您的代码库增长并且您的计算涉及多个包时,由于它后来创建的混淆。

可能的解决方案:

您已将sapply命令的输出与mydata列绑定。

试试这个:

set.seed(1L)
cols <- sample(c(1:5), 1) 
print(cols) # [1] 2
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
do.call("cbind",
        list( mydata,
              sapply( seq_len(cols), function(x) sample(c(1:10), 10) )
        ))

输出:

#     label    1  2
# 1   label 1  4  2
# 2   label 2  6  7
# 3   label 3  8  4
# 4   label 4  2  6
# 5   label 5  9  3
# 6   label 6  5  8
# 7   label 7  3  5
# 8   label 8  7 10
# 9   label 9  1  9
# 10 label 10 10  1

答案 1 :(得分:1)

我无法确定您的代码无法正常工作的原因,但它与您在运行sapply之前未定义的列有关。因此,如果事先定义data.frame,则可以正常使用

cols <- sample(c(1:5), 1) 
mydata <- data.frame(matrix(rep(0, 10*(cols+1)), ncol = cols+1))
mydata[, 1] <- rep(paste0("label ", seq(1,10)))
sapply(1:cols, function(x) {
  mydata[, x+1] <- sample(c(1:10), 10) } )

编辑:

您可以使用以下代码

cols <- sample(c(1:5), 1) 
mydata <- data.frame(rep(paste0("label ", seq(1,10))),
                     sapply(1:cols, function(x) {sample(c(1:10), 10) } ))