考虑以下动物园对象:
x <- data.frame(Date = seq(as.Date("2013-02-01"), length=6, by="1 month") - 1, x = seq(6))
y <- data.frame(Date = seq(as.Date("2013-02-01"), length=4, by="1 month"), y = seq(4))
z <- data.frame(Date = seq(as.Date("2012-11-01"), length=9, by="1 month"), z = seq(9))
x.zoo = zoo(x[,-1], order.by = x[,1])
y.zoo = zoo(y[,-1], order.by = y[,1])
z.zoo = zoo(z[,-1], order.by = z[,1])
请注意,3个动物园对象具有不同的长度。 我想将所有对象与变量“x”的日期对齐:换句话说,我想创建一个包含Date列(对象x的索引)的新数据帧,以及用最接近的可用观察值填充每个变量。
以下是我要找的结果:
Date x y z
1 2013-01-31 1 1 4
2 2013-02-28 2 2 5
3 2013-03-31 3 3 6
4 2013-04-30 4 4 NA
5 2013-05-31 5 NA NA
6 2013-06-30 6 NA NA
请注意,实际上,我有10个要与x对齐的变量。
我知道na.locf
包中的函数zoo
,但我不确定如何在多个动物园对象的上下文中对其进行调整。
无论如何我能有效地做到这一点吗?
谢谢!
答案 0 :(得分:5)
试试这个:
xx.zoo <- aggregate(x.zoo, as.yearmon)
yy.zoo <- aggregate(y.zoo, as.yearmon)
zz.zoo <- aggregate(z.zoo, as.yearmon)
out <- merge(x = xx.zoo, y = yy.zoo, z = zz.zoo, all = c(TRUE, FALSE, FALSE))
或者如果您不想写出来:
L <- setNames(list(x.zoo, y.zoo, z.zoo), c("x", "y", "z"))
all. <- c(TRUE, rep(FALSE, length(L) - 1)) # all FALSE except first
out <- do.call(merge, c(lapply(L, aggregate, as.yearmon), all = list(all.)))
给出:
> out
x y z
Jan 2013 1 NA 3
Feb 2013 2 1 4
Mar 2013 3 2 5
Apr 2013 4 3 6
May 2013 5 4 1
Jun 2013 6 NA 2
单位时间可能更合适,但如果对您来说重要的是时间与x.zoo
次相同,那么请添加以下内容:
time(out) <- time(x.zoo)
更新:小改进。
答案 1 :(得分:1)
另一种选择,使用@Ricardo Saporta建议的round_date
:
library(lubridate)
# round dates in x.zoo to nearest month
index(x.zoo) <- round_date(index(x.zoo), "month")
# merge
xyz <- merge(x = x.zoo, y = y.zoo, z = z.zoo, all = c(TRUE, FALSE, FALSE))
# make data frame from original x dates and data from zoo object
data.frame(Date = x$Date, coredata(xyz))
# Date x y z
# 1 2013-01-31 1 1 4
# 2 2013-02-28 2 2 5
# 3 2013-03-31 3 3 6
# 4 2013-04-30 4 4 7
# 5 2013-05-31 5 NA 8
# 6 2013-06-30 6 NA 9