我的df看起来像这样:
time,v1,v1,v3,v4
1352639505, , ,94,101
1352639565, , ,94,101
1352639505,10,222, ,
1352639565,11,221, ,
第一个是1970-01-01的UTC时间戳 - 所以我会用
as.POSIXct(df$time,origin="1970-01-01",tz="UTC")
。但是你可以看到日期是双倍的。跳过NAs和值。如何在数据框中合并相同的日期?首先设置为.POSIXct或合并?
结果应如下所示:
time,v1,v1,v3,v4
1352639505,10,222,94,101
1352639565,11,221,94,101
当然它也可能是真正约会的动物园后! 谢谢!
答案 0 :(得分:4)
我会单独处理data.frame的每一列。对于每列,从列和时间索引中删除缺少的观察,然后构造您的zoo
对象。然后,您可以使用do.call
在merge
个对象列表中调用zoo
。
# helper function to build zoo objects with no missing values
f <- function(v, i) {
na <- is.na(v)
iposix <- as.POSIXct(i, origin="1970-01-01", tz="UTC")
zoo(v[!na], iposix[!na])
}
df <- structure(list(time = c(1352639505L, 1352639565L, 1352639505L,
1352639565L), v1 = c(NA, NA, 10L, 11L), v1 = c(NA, NA, 222L,
221L), v3 = c(94L, 94L, NA, NA), v4 = c(101L, 101L, NA, NA)), .Names = c("time",
"v1", "v1", "v3", "v4"), class = "data.frame", row.names = c(NA, -4L))
library(zoo)
Data <- do.call(merge, lapply(df[-1], f, i=df$time))
Data
# v1 v1.1 v3 v4
# 2012-11-11 07:11:45 10 222 94 101
# 2012-11-11 07:12:45 11 221 94 101