计算R中间隔内的日期

时间:2018-04-13 17:43:45

标签: r date

鉴于以下一组日期加上每个日期结束的30天间隔,我想计算在该间隔内的日期数,例如

library(lubridate)
library(dplyr)
df = data.frame(id = c(1, 2, 3, 4, 5, 6),
               dates = as.Date(c('2017-01-15', '2017-01-17', '2017-02-01', 
                               '2017-02-12', '2017-03-30', '2017-04-01')))

df <- df %>% mutate(interval = interval(dates - 30, dates))

使用

sum(x$dates %within% x$interval[5])

正确返回1,因为只有一个日期属于第5个间隔,但我想以矢量化的方式对所有间隔进行此操作。任何建议表示赞赏。

1 个答案:

答案 0 :(得分:3)

使用purrr::map_int,我们可以按时间间隔浏览列,并获取每个列中的日期数。请注意,这不是&#34; vectorised&#34;但我认为你做了什么。

library(lubridate)
library(tidyverse)
df <- data.frame(
  id = c(1, 2, 3, 4, 5, 6),
  dates = as.Date(c(
    "2017-01-15", "2017-01-17", "2017-02-01",
    "2017-02-12", "2017-03-30", "2017-04-01"
  ))
)

df %>%
  mutate(
    interval = interval(dates - 30, dates),
    dates_in_intv = map_int(interval, function(x) sum(.$dates %within% x))
    )
#>   id      dates                       interval dates_in_intv
#> 1  1 2017-01-15 2016-12-16 UTC--2017-01-15 UTC             1
#> 2  2 2017-01-17 2016-12-18 UTC--2017-01-17 UTC             2
#> 3  3 2017-02-01 2017-01-02 UTC--2017-02-01 UTC             3
#> 4  4 2017-02-12 2017-01-13 UTC--2017-02-12 UTC             4
#> 5  5 2017-03-30 2017-02-28 UTC--2017-03-30 UTC             1
#> 6  6 2017-04-01 2017-03-02 UTC--2017-04-01 UTC             2

reprex package(v0.2.0)创建于2018-04-13。