如何一次性将多个列添加到data.frame?

时间:2014-08-18 06:05:00

标签: r

我有以下数据框和矢量:

ddf = data.frame(a=rep(1,10), b=rep(2,10))
xx = c("c", "d", "e", "f")

如何使用xx中的项目命名的新空列?

我试过以下但不起作用:

ddf = cbind(ddf, data.frame(xx))
Error in data.frame(..., check.names = FALSE) : 
  arguments imply differing number of rows: 10, 4

以下也不起作用:

for(i in 1:length(xx)){
    ddf$(xx[i]) = ""  
}

Error: unexpected '(' in:
"for(i in 1:length(xx)){
ddf$("
 }
Error: unexpected '}' in "}"

2 个答案:

答案 0 :(得分:29)

这会让你到达那里:

ddf[xx] <- NA

#   a b  c  d  e  f
#1  1 2 NA NA NA NA
#2  1 2 NA NA NA NA
#3  1 2 NA NA NA NA
#...

您无法直接使用ddf$xx之类的内容,因为这会尝试分配给名为xx的列,而不是解释xx。您需要使用[[<-函数,在处理字符串/向量时使用方括号 - 如ddf["columnname"]ddf[c("col1","col2")]

选择列的原因是因为data.frames本质上是列表:

is.list(ddf)
#[1] TRUE

as.list(ddf)
#$a
# [1] 1 1 1 1 1 1 1 1 1 1
# 
#$b
# [1] 2 2 2 2 2 2 2 2 2 2

...每列对应一个列表条目。因此,如果您不使用逗号指定行,例如ddf["name",]或像ddf[,"name"]这样的列,则默认情况下会显示该列。

答案 1 :(得分:4)

这似乎成功了:

> cbind(ddf, setNames( lapply(xx, function(x) x=NA), xx) )
   a b  c  d  e  f
1  1 2 NA NA NA NA
2  1 2 NA NA NA NA
3  1 2 NA NA NA NA
4  1 2 NA NA NA NA
5  1 2 NA NA NA NA
6  1 2 NA NA NA NA
7  1 2 NA NA NA NA
8  1 2 NA NA NA NA
9  1 2 NA NA NA NA
10 1 2 NA NA NA NA