计算r中两个日期之间的天数

时间:2015-02-27 16:13:35

标签: r

我需要以两种方式计算多个日期之间经过的天数,然后将这些结果输出到新列:i)与第一个日期相比已经过的天数(例如,结果$ FIRST)和ii在连续日期之间(例如,结果$ BETWEEN)。这是一个具有所需结果的示例。提前谢谢。

library(lubridate)

DATA = data.frame(DATE = mdy(c("7/8/2013",  "8/1/2013", "8/30/2013", "10/23/2013", 
                                   "12/16/2013", "12/16/2015")))

RESULTS  = data.frame(DATE = mdy(c("7/8/2013",  "8/1/2013", "8/30/2013", "10/23/2013", 
                                       "12/16/2013", "12/16/2015")), 
                  FIRST = c(0, 24, 53, 107, 161, 891), BETWEEN = c(0, 24, 29, 54, 54, 730))

4 个答案:

答案 0 :(得分:10)

#Using dplyr package
library(dplyr)
df1 %>%  # your dataframe
mutate(BETWEEN0=as.numeric(difftime(DATE,lag(DATE,1))),BETWEEN=ifelse(is.na(BETWEEN0),0,BETWEEN0),FIRST=cumsum(as.numeric(BETWEEN)))%>%
select(-BETWEEN0)
            DATE BETWEEN FIRST
    1 2013-07-08       0     0
    2 2013-08-01      24    24
    3 2013-08-30      29    53
    4 2013-10-23      54   107
    5 2013-12-16      54   161
    6 2015-12-16     730   891

答案 1 :(得分:1)

这样可以得到你想要的东西:

d <- as.Date(DATA$DATE, format="%m/%d/%Y")

first <- c()
for (i in seq_along(d))
    first[i] <- d[i] - d[1]

between <- c(0, diff(d))

这使用基础包中的as.Date()函数,使用给定的格式将字符串日期的向量强制转换为日期值。由于您的日期为月/日/年,因此请指定format="%m/%d/%Y"以确保其正确解释。

diff()是滞后的差异。由于它是滞后的,它不包括元素1和它自身之间的差异,因此你可以连接一个0。

默认情况下,Date个对象之间的差异以天为单位。

然后构造输出数据帧很简单:

RESULTS <- data.frame(DATE=DATA$DATE, FIRST=first, BETWEEN=between)

答案 2 :(得分:0)

第一部分:

DATA = data.frame((c("7/8/2013",  "8/1/2013", "8/30/2013", "10/23/2013","12/16/2013", "12/16/2015")))
names(DATA)[1] = "V1"
date = as.Date(DATA$V1, format="%m/%d/%Y")
print(date-date[1])

结果:

[1]   0  24  53 107 161 891

第二部分 - 只需使用for循环

答案 3 :(得分:0)

您只需使用简单difftime和滞后diff计算添加每列。

DATA$FIRST <- c(0, 
                with(DATA, 
                     difftime(DATE[2:length(DATE)],DATE[1], unit="days")
                     )
                )
DATA$BETWEEN <- c(0, 
                  with(DATA, 
                       diff(DATE[1:(length(DATE) - 1)], unit="days")
                       )
                  )

identical(DATA, RESULTS)
[1] TRUE