数据帧合并中的双时间戳

时间:2013-04-25 19:32:43

标签: r utc zoo

我的df看起来像这样:

time,v1,v1,v3,v4
1352639505, , ,94,101
1352639565, , ,94,101
1352639505,10,222, ,
1352639565,11,221, ,

第一个是1970-01-01的UTC时间戳 - 所以我会用 as.POSIXct(df$time,origin="1970-01-01",tz="UTC")。但是你可以看到日期是双倍的。跳过NAs和值。如何在数据框中合并相同的日期?首先设置为.POSIXct或合并?

结果应如下所示:

time,v1,v1,v3,v4
1352639505,10,222,94,101
1352639565,11,221,94,101

当然它也可能是真正约会的动物园后! 谢谢!

1 个答案:

答案 0 :(得分:4)

我会单独处理data.frame的每一列。对于每列,从列和时间索引中删除缺少的观察,然后构造您的zoo对象。然后,您可以使用do.callmerge个对象列表中调用zoo

# helper function to build zoo objects with no missing values
f <- function(v, i) {
  na <- is.na(v)
  iposix <- as.POSIXct(i, origin="1970-01-01", tz="UTC")
  zoo(v[!na], iposix[!na])
}
df <- structure(list(time = c(1352639505L, 1352639565L, 1352639505L, 
1352639565L), v1 = c(NA, NA, 10L, 11L), v1 = c(NA, NA, 222L, 
221L), v3 = c(94L, 94L, NA, NA), v4 = c(101L, 101L, NA, NA)), .Names = c("time", 
"v1", "v1", "v3", "v4"), class = "data.frame", row.names = c(NA, -4L))
library(zoo)
Data <- do.call(merge, lapply(df[-1], f, i=df$time))
Data
#                     v1 v1.1 v3  v4
# 2012-11-11 07:11:45 10  222 94 101
# 2012-11-11 07:12:45 11  221 94 101