组合和合并一系列数据帧

时间:2015-02-20 01:09:58

标签: r loops for-loop dataframe rbind

我有一系列n个数据帧,格式为:

n<-10 
k<-5 
d1 <- data.frame()
for(i in 1:(k)) {d1 <- rbind(d1,c(a="i+1",b="i-1",c="i/1"))}
d2 <- data.frame()
for(i in 1:(k+2)) {d2 <- rbind(d2,c(a="i+2",b="i-2",c="i/2"))}
d3 <- data.frame()
for(i in 1:(k+3)) {d3 <- rbind(d3,c(i+3, i-3, i/3))}

...

d10 <- data.frame()
for(i in 1:(k+10)) {d10 <- rbind(d10,c(i+10, i-10, i/10))}

我有这个数据帧序列列表,我希望将其合并到一个组合数据帧中。我试过这个:

total <- rbind(d1, d2,d3)

但得到了错误。

Error in match.names(clabs, names(xi)) : 
  names do not match previous names

使用其他方法:

D <- list(d1,d2,d3)
newD <- data.frame()
for(i in 1:length(D)) {
  newD <- rbind(newD, cbind(frame=rep(i,length(D[[i]])),D[[i]]))
}
newD 

但又错了。

Error in data.frame(..., check.names = FALSE) : 
  arguments imply differing number of rows: 3, 5

使用相同的方法(rbind)和类似基础的方法获得答案会很棒。两者都有助于我的理解。当然,如果情况明显,请指出我哪里出错。

1 个答案:

答案 0 :(得分:2)

names(df)之后,只需在这种情况下使用rbind。您rbind的每个数据框都需要具有相同的列名。来自?rbind

  

...然后它从第一个数据框中获取列的类,并按名称(而不是按位置)匹配列。

因此,对于您的示例,您只需要为rbind的每个数据框指定相同的列名:

k<-5 
d1 <- data.frame()
for(i in 1:(k)) {d1 <- rbind(d1,c(a=i+1,b=i-1,c=i/1)); names(d1) <- letters[1:3]}
d2 <- data.frame()
for(i in 1:(k+2)) {d2 <- rbind(d2,c(a=i+2,b=i-2,c=i/2)); names(d2) <- letters[1:3]}
d3 <- data.frame()
for(i in 1:(k+3)) {d3 <- rbind(d3,c(a=i+3, b=i-3, c=i/3)); names(d3) <- letters[1:3]}

> rbind(d1, d2, d3)

    a  b         c
1   2  0 1.0000000
2   3  1 2.0000000
3   4  2 3.0000000
4   5  3 4.0000000
5   6  4 5.0000000
6   3 -1 0.5000000
7   4  0 1.0000000
8   5  1 1.5000000
9   6  2 2.0000000
10  7  3 2.5000000
11  8  4 3.0000000
12  9  5 3.5000000
13  4 -2 0.3333333
14  5 -1 0.6666667
15  6  0 1.0000000
16  7  1 1.3333333
17  8  2 1.6666667
18  9  3 2.0000000
19 10  4 2.3333333
20 11  5 2.6666667

还有一些关于您的示例的评论:您可以执行:d1 <- rbind(d1, c(...)),而不是使用d1 <- data.frame(a = i + 1, b = i + 2, c = i + 3)。然后你甚至不需要重命名你的专栏,因为他们都保持原样。