我正在循环播放一系列15个文件。我的循环看起来像这样:
for (i in 1:length(mod.f)) {
do some stuff
dataframe `df` is produced
}
循环的每次迭代都会产生一个包含两列的数据框 - 日期和某些值,就像下面的例子一样:
df <- structure(list(date = structure(c(-43829, -43798, -43770, -43739,
-43709, -43678, -43648, -43617, -43586, -43556, -43525, -43495,
-43464, -43433, -43405, -43374, -43344, -43313, -43283, -43252
), class = "Date"), inmcm4 = c(71.4782417258324, 68.5037706662898,
64.0571482842429, 62.8708849771957, 66.3121740437669, 62.7535770507166,
62.2819567665719, 62.3014754255822, 58.6247123853888, 58.4425949480101,
61.3534245382973, 68.2531958750396, 70.4892992599108, 70.1840748468477,
64.6298343911645, 66.5280510648649, 65.2767506692563, 62.8944646174169,
60.4309882672837, 58.7368776782633)), .Names = c("date", "inmcm4"
), row.names = c(NA, 20L), class = "data.frame")
这里的问题是并非所有数据帧都具有相同的长度。每个数据帧的长度如下:
1872
1740
1872
1932
1872
1752
1752
1872
1872
672
1872
1872
1956
1956
1872
因此,并非所有日期(例如df $ date)都相同。
我希望在循环结束时将所有数据帧合并到一个数据帧中。此最终数据框应具有date
列,其余列将是每次迭代的值,将NA分配给不重叠的日期。
关于如何做到这一点的任何想法?
谢谢!
答案 0 :(得分:1)
你可以尝试
Reduce(function(...) merge(..., by='date', all=TRUE), lst)
其中lst
是data.frames列表
set.seed(24)
df2 <- df[sample(1:nrow(df),8, replace=FALSE),]
row.names(df2) <- NULL
lst <- list(df, df2)