我正在进行时间序列分析,我希望开发具有不同分析单位的多个数据集。即:数据集1中的单位将是国家X中的区域,为期2年,跨度为4年(districtYearPeriodCode),数据集2中的单位将是国家X中的区域,为期4周内的区域4年,等等。
我创建了许多数据框,包含每个间隔的开始和结束日期,以及间隔ID。以下一个是为期2周的间隔。
begin <- seq(ymd('2004-01-01'),ymd('2004-06-30'), by = as.difftime(weeks(2)))
end <- seq(ymd('2004-01-14'),ymd('2004-06-30'), by = as.difftime(weeks(2)))
interval <- seq(1,13,1)
df2 <- data.frame(begin, end, interval)
begin end interval
1 2004-01-01 2004-01-14 1
2 2004-01-15 2004-01-28 2
3 2004-01-29 2004-02-11 3
4 2004-02-12 2004-02-25 4
5 2004-02-26 2004-03-10 5
6 2004-03-11 2004-03-24 6
7 2004-03-25 2004-04-07 7
8 2004-04-08 2004-04-21 8
9 2004-04-22 2004-05-05 9
10 2004-05-06 2004-05-19 10
11 2004-05-20 2004-06-02 11
12 2004-06-03 2004-06-16 12
13 2004-06-17 2004-06-30 13
除此之外,我还有一个数据框,其中包含事件的观察,包括日期。它看起来像这样:
new.df3 <- data.frame(dates5, districts5)
new.df3
dates5 districts5
1 2004-01-01 d1
2 2004-01-02 d2
3 2004-01-03 d3
4 2004-01-04 d4
5 2004-01-05 d5
我可以编写一个函数,还是可以使用命令来结束这样的事情?
dates5 districts5 interval5
1 2004-01-01 d1 1
2 2004-01-02 d2 1
3 2004-01-03 d3 1
4 2004-01-04 d4 1
5 2004-01-05 d5 1
我一直试图在lubridate包中或其他线程中找到答案,但所有答案似乎都是为了确定日期是否属于特定的时间间隔而不是识别间隔日期属于一组间隔。
很受欢迎!答案 0 :(得分:0)
我在here使用了@alistair概述的purrr。我在下面重现:
elements %>%
map(~intervals$phase[.x >= intervals$start & .x <= intervals$end]) %>%
# Clean up a bit. Shorter, but less readable: map_chr(~.x[1] %||% NA)
map_chr(~ifelse(length(.x) == 0, NA, .x))
## [1] "a" "a" "a" NA "b" "b" "c"