使用dplyr在R中的日期数据

时间:2018-06-18 17:13:22

标签: r dplyr tidyverse lubridate

我的数据包含每个主题的两列日期数据,例如date1和date2,其中date1< DATE2。如何创建一个变量,指示给定主题的date1的下一个值是否在日期2的当前值之前?对于以下数据,例如:

subject date1      date2      
1       2018-01-01 2019-01-01
1       2018-02-01 2019-01-01
1       2020-01-01 2021-01-01

指标变量对于第一行应为1,对于第二行应为0,对于第三行应为NA。

1 个答案:

答案 0 :(得分:1)

我们可以使用lead来比较下一个' date1'与当前' date2'经过' subject'

分组后
library(dplyr)
df1 %>%
   group_by(subject) %>% 
   mutate(new = as.integer(lead(date1) < date2))
# A tibble: 3 x 4
# Groups:   subject [1]
#  subject date1      date2       new
#    <int> <date>     <date>     <int>
#1       1 2018-01-01 2019-01-01     1
#2       1 2018-02-01 2019-01-01     0
#3       1 2020-01-01 2021-01-01    NA

数据

df1 <- structure(list(subject = c(1L, 1L, 1L), date1 = structure(c(17532, 
 17563, 18262), class = "Date"), date2 = structure(c(17897, 17897, 
  18628), class = "Date")), .Names = c("subject", "date1", "date2"
 ), row.names = c(NA, -3L), class = "data.frame")