按周分割的xts将星期的第一天指定为星期日,而不是默认的星期一

时间:2018-04-01 23:07:48

标签: r split time-series xts

split函数应用于xts对象weeks将行分组为每周块。该群组中的默认天数为MondaySunday。如果我希望群组中的日期从SundaySaturday,我该怎么办?

library(xts)
idx <- as.Date("2018-3-1") + 0:14
v <- 1:15
x <- xts(v, idx)
group <- split(x, f = 'weeks')
group

Output:
[[1]]
           [,1]
2018-03-01    1  # Thursday
2018-03-02    2  # Friday
2018-03-03    3  # Saturday
2018-03-04    4  # Sunday

[[2]]
           [,1]
2018-03-05    5  # Monday
2018-03-06    6  # Tuesday
2018-03-07    7  # Wednesday
2018-03-08    8  # Thursday
2018-03-09    9  # Friday
2018-03-10   10  # Saturday
2018-03-11   11  # Sunday

[[3]]
           [,1]
2018-03-12   12  # Monday
2018-03-13   13  # Tuesday
2018-03-14   14  # Wednesday
2018-03-15   15  # Thursday

Desired Output:
[[1]]
           [,1]
2018-03-01    1  # Thursday
2018-03-02    2  # Friday
2018-03-03    3  # Saturday

[[2]]
           [,1]
2018-03-04    4  # Sunday
2018-03-05    5  # Monday
2018-03-06    6  # Tuesday
2018-03-07    7  # Wednesday
2018-03-08    8  # Thursday
2018-03-09    9  # Friday
2018-03-10   10  # Saturday

[[3]]
           [,1]
2018-03-11   11  # Sunday
2018-03-12   12  # Monday
2018-03-13   13  # Tuesday
2018-03-14   14  # Wednesday
2018-03-15   15  # Thursday

2 个答案:

答案 0 :(得分:7)

我在星期日而不是星期一频繁地分开几周,因为我使用外汇数据(市场在纽约东部时间周日下午开市)。这是一个有效的解决方案split_FXweeks,使用&#34; xts方式&#34;拆分时间序列数据。当您长时间使用高密度刻度数据时,这种方法非常快。

这个技巧归功于下面链接中的技巧1(你可能会觉得很有帮助,就像我多年前学习R / xts时那样):http://darrendev.blogspot.com.au/2012/08/small-rxts-code-snippets-and-tips.html

与其他建议的方法相比,添加了基准作为基线。

idx <- as.Date("2018-3-1") + 0:14
v <- 1:15
x <- xts(v, idx)


split_FXweeks <- function(x) {
  ep <- .Call("endpoints", .index(x) + 4L * 86400L, 604800L, 
              1, TRUE, PACKAGE = "xts")
  sp <- (ep + 1)[-length(ep)]
  ep <- ep[-1]
  lapply(1:length(ep), function(X) x[sp[X]:ep[X]])
}


split1 <- function(idx, x) {
  week_num <- format(idx, "%U")
  group <- unname(split(x, f = week_num))
  group
}

library(microbenchmark)
microbenchmark(
  y <- split_FXweeks(x),
  z <- split1(idx, x))
# Unit: microseconds
# expr     min      lq      mean   median       uq     max neval
# y <- split_FXweeks(x)  52.521  60.167  72.90766  75.2390  80.6495 162.077   100
# z <- split1(idx, x) 325.681 351.658 383.13293 364.2215 384.9765 881.486   100
# > y
# [[1]]
# [,1]
# 2018-03-01    1
# 2018-03-02    2
# 2018-03-03    3
# 
# [[2]]
# [,1]
# 2018-03-04    4
# 2018-03-05    5
# 2018-03-06    6
# 2018-03-07    7
# 2018-03-08    8
# 2018-03-09    9
# 2018-03-10   10
# 
# [[3]]
# [,1]
# 2018-03-11   11
# 2018-03-12   12
# 2018-03-13   13
# 2018-03-14   14
# 2018-03-15   15

答案 1 :(得分:2)

考虑从星期日开始的工作日创建一个周数的外部等长向量,其格式为%U。请参阅?strftime

  

%U

     

以星期日为第一的十进制数字(00-53)   一周中的第一天(通常是一年中的第一个星期日)   第1周第1天)。美国公约。

week_num <- format(idx, "%U")
group <- unname(split(x, f = week_num))
group

[[1]]

2018-03-01 1
2018-03-02 2
2018-03-03 3

[[2]]

2018-03-04  4
2018-03-05  5
2018-03-06  6
2018-03-07  7
2018-03-08  8
2018-03-09  9
2018-03-10 10

[[3]]

2018-03-11 11
2018-03-12 12
2018-03-13 13
2018-03-14 14
2018-03-15 15