鉴于以下一组日期加上每个日期结束的30天间隔,我想计算在该间隔内的日期数,例如
library(lubridate)
library(dplyr)
df = data.frame(id = c(1, 2, 3, 4, 5, 6),
dates = as.Date(c('2017-01-15', '2017-01-17', '2017-02-01',
'2017-02-12', '2017-03-30', '2017-04-01')))
df <- df %>% mutate(interval = interval(dates - 30, dates))
使用
sum(x$dates %within% x$interval[5])
正确返回1,因为只有一个日期属于第5个间隔,但我想以矢量化的方式对所有间隔进行此操作。任何建议表示赞赏。
答案 0 :(得分:3)
使用purrr::map_int
,我们可以按时间间隔浏览列,并获取每个列中的日期数。请注意,这不是&#34; vectorised&#34;但我认为你做了什么。
library(lubridate)
library(tidyverse)
df <- data.frame(
id = c(1, 2, 3, 4, 5, 6),
dates = as.Date(c(
"2017-01-15", "2017-01-17", "2017-02-01",
"2017-02-12", "2017-03-30", "2017-04-01"
))
)
df %>%
mutate(
interval = interval(dates - 30, dates),
dates_in_intv = map_int(interval, function(x) sum(.$dates %within% x))
)
#> id dates interval dates_in_intv
#> 1 1 2017-01-15 2016-12-16 UTC--2017-01-15 UTC 1
#> 2 2 2017-01-17 2016-12-18 UTC--2017-01-17 UTC 2
#> 3 3 2017-02-01 2017-01-02 UTC--2017-02-01 UTC 3
#> 4 4 2017-02-12 2017-01-13 UTC--2017-02-12 UTC 4
#> 5 5 2017-03-30 2017-02-28 UTC--2017-03-30 UTC 1
#> 6 6 2017-04-01 2017-03-02 UTC--2017-04-01 UTC 2
由reprex package(v0.2.0)创建于2018-04-13。