合并R中具有不同行长度的多个data.frames

时间:2014-02-25 18:39:51

标签: r merge dataframe

我对R相对较新,并试图弄清楚如何合并多个data.frames与不同数量的行,但都有一个共同的列,“年”。我看过类似的问题,这个问题: Merge dataframes, different lengths 提供了很好的答案。但是,当我将它应用于我自己的数据时,我无法使用多个data.frames;我总是收到一条错误消息。

示例数据:

> df1 <- data.frame(Year=2006:2011, Site1=c("2.3", "1"  , "3.1", "2.9", "1.4", "3"))  
> df2 <- data.frame(Year=2007:2011, Site2=c("2.7", "4.1", "1.1", "2.6", "3.1"))  
> df3 <- data.frame(Year=2008:2011, Site3=c("1.3", "2"  , "3.6", "1.7"))  

目标是生成单个data.frame,其中第1列是年份,第2列是站点1,第3列是站点2,依此类推。我目前有~17个data.frames(最多40个),相当于17个具有可变时间轴/行数的站点。

任何帮助都将不胜感激。

我试过的代码:

> NewDF <- merge(df1, df2, by="Year", all.x=TRUE, all.y=TRUE)  

这适用于2个data.frames,但当我尝试添加另一个data.frame时,我收到了错误消息:

> NewDF <- merge(list=c(df1, df2, df3), by="Year", all.x=TRUE, all.y=TRUE)  
 Error in as.data.frame(x) : argument "x" is missing, with no default

1 个答案:

答案 0 :(得分:11)

您希望将结果与df3合并,即:

merge(df3, merge(df1, df2, by="Year", all.x=TRUE, all.y=TRUE), by = "Year", all.x = TRUE, all.y = TRUE)
#  Year Site3 Site1 Site2
#1 2006  <NA>   2.3  <NA>
#2 2007  <NA>     1   2.7
#3 2008   1.3   3.1   4.1
#4 2009     2   2.9   1.1
#5 2010   3.6   1.4   2.6
#6 2011   1.7     3   3.1

或者,如果列表中包含data.frame,请使用Reduce来概括上述内容:

Reduce(function(x,y) merge(x, y, by = "Year", all.x = TRUE, all.y = TRUE),
       list(df1, df2, df3))
#  Year Site1 Site2 Site3
#1 2006   2.3  <NA>  <NA>
#2 2007     1   2.7  <NA>
#3 2008   3.1   4.1   1.3
#4 2009   2.9   1.1     2
#5 2010   1.4   2.6   3.6
#6 2011     3   3.1   1.7