R - 循环后组合不同长度的数据帧

时间:2015-05-14 10:13:23

标签: r loops merge dataframe

我正在循环播放一系列15个文件。我的循环看起来像这样:

for (i in 1:length(mod.f)) {
    do some stuff
    dataframe `df` is produced
}

循环的每次迭代都会产生一个包含两列的数据框 - 日期和某些值,就像下面的例子一样:

df <- structure(list(date = structure(c(-43829, -43798, -43770, -43739, 
-43709, -43678, -43648, -43617, -43586, -43556, -43525, -43495, 
-43464, -43433, -43405, -43374, -43344, -43313, -43283, -43252
), class = "Date"), inmcm4 = c(71.4782417258324, 68.5037706662898, 
64.0571482842429, 62.8708849771957, 66.3121740437669, 62.7535770507166, 
62.2819567665719, 62.3014754255822, 58.6247123853888, 58.4425949480101, 
61.3534245382973, 68.2531958750396, 70.4892992599108, 70.1840748468477, 
64.6298343911645, 66.5280510648649, 65.2767506692563, 62.8944646174169, 
60.4309882672837, 58.7368776782633)), .Names = c("date", "inmcm4"
), row.names = c(NA, 20L), class = "data.frame")

这里的问题是并非所有数据帧都具有相同的长度。每个数据帧的长度如下:

1872 
1740 
1872 
1932 
1872 
1752 
1752 
1872 
1872 
672 
1872 
1872 
1956 
1956 
1872

因此,并非所有日期(例如df $ date)都相同。

我希望在循环结束时将所有数据帧合并到一个数据帧中。此最终数据框应具有date列,其余列将是每次迭代的值,将NA分配给不重叠的日期。

关于如何做到这一点的任何想法?

谢谢!

1 个答案:

答案 0 :(得分:1)

你可以尝试

 Reduce(function(...) merge(..., by='date', all=TRUE), lst)

其中lst是data.frames列表

数据

set.seed(24)
df2 <- df[sample(1:nrow(df),8, replace=FALSE),]
row.names(df2) <- NULL
lst <- list(df, df2)