Question

我正在使用从上午9:50开始的日内数据，并希望将其转换为20分钟的时间间隔，因此第一个时段将是从09:50到10:09:59，第二个时间段将是从10:10到10:29:59然而来自to.minutes()包的xts似乎将它固定在小时和时间栏上09:59:59和10:19:59等等...即它是10分钟......我知道它可能不是一个常规的请求...但无论如何这样做是为了使它具有正确的端点，即基于frist时间戳？

并获得奖励积分......有没有办法根据最终时间戳做到这一点？（即从该时间戳生成期末端点？

这里有一个例子，说明我的观点是10分钟（我想要的）

x <- xts(rnorm(24*60*60), as.POSIXct(format(paste(Sys.Date(),'09:50')))-((24*60*60):1))
head(x)
x1 <- to.minutes(x, 20)
head(x1)

我可以想办法通过使用分割，剪切，lapplys do.calls和rbinds来纠正这个问题....但我基本上会重新创建一个OHLC对象...并且觉得它可能效率低下与现有解决方案进行比较......

Answer 1

这是一个有用的技巧，应该在xts文档中更为突出。

从xts对象

开始

R> set.seed(42)   ## fix seed
R> X <- xts(cumsum(rnorm(100))+100, order.by=Sys.time()+cumsum(runif(100)))
R> head(X)
                              [,1]
2012-10-05 06:42:20.299761 101.371
2012-10-05 06:42:20.816872 100.806
2012-10-05 06:42:21.668803 101.169
2012-10-05 06:42:22.111599 101.802
2012-10-05 06:42:22.269479 102.207
2012-10-05 06:42:22.711804 102.100

鉴于这个不规则的系列，我们希望按照我们强加的定期间隔进行分组。在这里，我创建了一个两秒的间隔。如果与索引属于同一类型，那么任何其他工作，POSIXct。

R> ind <- seq(start(X) - as.numeric(start(X)-round(start(X))) + 1, + end(X), by="2 secs") R> head(ind) [1] "2012-10-05 06:42:21 CDT" "2012-10-05 06:42:23 CDT" [3] "2012-10-05 06:42:25 CDT" "2012-10-05 06:42:27 CDT" [5] "2012-10-05 06:42:29 CDT" "2012-10-05 06:42:31 CDT" R>

现在的诀窍是将常规系列与不规则系列合并，在其上调用na.locf()以将最后一个良好的不规则遮挡调用到新的时间网格上 - 然后在时间网格上进行子集化：

R> na.locf(merge(X, xts(,ind)))[ind] X 2012-10-05 06:42:21 100.8063 2012-10-05 06:42:23 102.1004 2012-10-05 06:42:25 105.4730 2012-10-05 06:42:27 107.2635 2012-10-05 06:42:29 104.9588 2012-10-05 06:42:31 101.7505 2012-10-05 06:42:33 104.6884 2012-10-05 06:42:35 103.6441 2012-10-05 06:42:37 101.6476 2012-10-05 06:42:39 98.6246 2012-10-05 06:42:41 97.9922 2012-10-05 06:42:43 97.7545 2012-10-05 06:42:45 101.0187 2012-10-05 06:42:47 98.0331 2012-10-05 06:42:49 100.7752 2012-10-05 06:42:51 103.0702 2012-10-05 06:42:53 102.6578 2012-10-05 06:42:55 103.1342 2012-10-05 06:42:57 103.4714 2012-10-05 06:42:59 102.3683 2012-10-05 06:43:01 105.0394 2012-10-05 06:43:03 103.9775 R>

瞧。

Answer 2

我最近遇到了类似的挑战（在下午5点开始分配FX数据）。从您的测试数据开始：

library(xts)
set.seed(42)
x <- xts(rnorm(24*60*60), as.POSIXct(format(paste(Sys.Date(),'09:50')))-((24*60*60):1))

将其向后移动10分钟，进行拆分，然后将拆分数据向前移动10分钟：

offset <- 600
index(x) <- index(x) - offset
x1 <- to.minutes(x, 20)
index(x1) <- index(x1) + offset

（注意：这会破坏x;要么在副本上工作，要么在index(x) <- index(x) + offset之后进行。 x1看起来像：

                        x.Open   x.High     x.Low    x.Close
2012-10-06 10:09:59  1.3709584 3.495304 -3.371739  0.4408241
2012-10-06 10:29:59 -0.7465165 3.584659 -2.828475  0.5938161
2012-10-06 10:49:59  1.3275046 3.174520 -3.199558 -0.6273660
...
2012-10-07 09:09:59 -0.83742490 3.103466 -3.251721 -1.093380
2012-10-07 09:29:59 -0.48464537 3.228048 -3.113351 -1.572931
2012-10-07 09:49:59  1.90503697 3.420940 -3.505207  2.832325

神奇的数字600来了，因为你的最后刻度距前一个20分钟的边界是600秒。以下是动态计算的方法：

offset <- ( as.integer(last(index(x))) %% 1200 ) + 1

as.integer将最后一次刻度的时间转换为自1970年以来的秒数。（如果时间戳中有毫秒，请使用as.numeric。）%%1200向下舍入到20分钟的边界。最后，+1是因为to.minutes将XX：XX：00视为一个栏的 start ，而不是前一个栏的 end 。

to.minutes使用自定义端点

2 个答案: