如何按秒对xts时间序列进行分组/求和

时间:2018-12-03 23:51:52

标签: r time-series aggregate xts

任何软件包都可以执行以下示例吗?我有毫秒级的大xts数据集。
我可以将coredata汇总到第二级吗?
时间是索引。

例如:

enter image description here

理想的结果是:

enter image description here

2 个答案:

答案 0 :(得分:2)

library(xts)

# To see subsecond timestamp values:
options(digits.secs = 3)

set.seed(1)
x <- xts(rnorm(10), as.POSIXct("2018-11-01 00:00:00.3") + seq(0.05, 3, length.out = 10))
# [,1]
# 2018-11-01 00:00:00.349 -0.6264538
# 2018-11-01 00:00:00.677  0.1836433
# 2018-11-01 00:00:01.005 -0.8356286
# 2018-11-01 00:00:01.333  1.5952808
# 2018-11-01 00:00:01.661  0.3295078
# 2018-11-01 00:00:01.988 -0.8204684
# 2018-11-01 00:00:02.316  0.4874291
# 2018-11-01 00:00:02.644  0.7383247
# 2018-11-01 00:00:02.972  0.5757814
# 2018-11-01 00:00:03.299 -0.3053884

要对第二个点内的值求和,可以使用xts的period.apply,并结合使用xts的endpoints查找每秒内最后一次观测的索引:

ep <- endpoints(x, on = "seconds", k = 1)

xs <- period.apply(x, ep, sum)

可能不希望使用“整秒”时间戳,然后可以使用xts的align.time对其进行修正,将其舍入到秒的末尾(重要的是舍入到秒的末尾以避免产生前瞻性偏差在您的数据中

xs
#                               [,1]
# 2018-11-01 00:00:00.677 -0.4428105
# 2018-11-01 00:00:01.988  0.2686916
# 2018-11-01 00:00:02.972  1.8015351
# 2018-11-01 00:00:03.299 -0.3053884

xs <- align.time(xs, n = 1)
xs
#                           [,1]
# 2018-11-01 00:00:01 -0.4428105
# 2018-11-01 00:00:02  0.2686916
# 2018-11-01 00:00:03  1.8015351
# 2018-11-01 00:00:04 -0.3053884

答案 1 :(得分:1)

您可以使用aggregate.zoo()软件包中的zoo进行汇总。

library(xts)
library(zoo)

# A simple example time series
xx <- xts(1:20, as.POSIXct((1:20)/5, origin="2000-01-01"))

aggregate(xx, as.POSIXct(trunc(time(xx), "sec")), sum)

# 2000-01-01 01:00:00 10
# 2000-01-01 01:00:01 35
# 2000-01-01 01:00:02 60
# 2000-01-01 01:00:03 85
# 2000-01-01 01:00:04 20