我有一个406829行的数据框,其中日期以POSIXt格式表示。下面是一个示例数据:
CustomerID InvoiceDate
12346 2011-01-18 10:01:00
12346 2011-01-18 10:17:00
12346 2010-12-07 14:57:00
12347 2011-01-26 14:30:00
12347 2011-04-07 10:43:00
12348 2011-06-09 13:01:00
我想找到每个客户ID的每个日期之间的天数差异。
我已经尝试了以下链接中给出的方法:How to calculate number of days between two dates in one column in R
这是我使用的代码:
df_3 <- df_2 %>%
group_by(CustomerID, InvoiceDate) %>%
mutate(dt = as.numeric(lead(InvoiceDate, default = last(InvoiceDate)) - InvoiceDate))
运行此命令时,R给出的输出中的日期差如下所示:第一行中的日期与最后一行中的日期之间的差,第二行中的日期与最后一行中的日期之间的差,依此类推。 / p>
我希望程序分别计算每个客户的发票日期差。这是我需要的输出:
CustomerID InvoiceDate Difference
12346 2011-01-18 10:01:00 0
12346 2011-01-18 10:17:00 0
12346 2010-12-07 14:57:00 0
12347 2011-01-26 14:30:00 67
12347 2011-04-07 10:43:00 62
12348 2011-06-09 13:01:00