我需要以两种方式计算多个日期之间经过的天数,然后将这些结果输出到新列:i)与第一个日期相比已经过的天数(例如,结果$ FIRST)和ii在连续日期之间(例如,结果$ BETWEEN)。这是一个具有所需结果的示例。提前谢谢。
library(lubridate)
DATA = data.frame(DATE = mdy(c("7/8/2013", "8/1/2013", "8/30/2013", "10/23/2013",
"12/16/2013", "12/16/2015")))
RESULTS = data.frame(DATE = mdy(c("7/8/2013", "8/1/2013", "8/30/2013", "10/23/2013",
"12/16/2013", "12/16/2015")),
FIRST = c(0, 24, 53, 107, 161, 891), BETWEEN = c(0, 24, 29, 54, 54, 730))
答案 0 :(得分:10)
#Using dplyr package
library(dplyr)
df1 %>% # your dataframe
mutate(BETWEEN0=as.numeric(difftime(DATE,lag(DATE,1))),BETWEEN=ifelse(is.na(BETWEEN0),0,BETWEEN0),FIRST=cumsum(as.numeric(BETWEEN)))%>%
select(-BETWEEN0)
DATE BETWEEN FIRST
1 2013-07-08 0 0
2 2013-08-01 24 24
3 2013-08-30 29 53
4 2013-10-23 54 107
5 2013-12-16 54 161
6 2015-12-16 730 891
答案 1 :(得分:1)
这样可以得到你想要的东西:
d <- as.Date(DATA$DATE, format="%m/%d/%Y")
first <- c()
for (i in seq_along(d))
first[i] <- d[i] - d[1]
between <- c(0, diff(d))
这使用基础包中的as.Date()
函数,使用给定的格式将字符串日期的向量强制转换为日期值。由于您的日期为月/日/年,因此请指定format="%m/%d/%Y"
以确保其正确解释。
diff()
是滞后的差异。由于它是滞后的,它不包括元素1和它自身之间的差异,因此你可以连接一个0。
默认情况下,Date
个对象之间的差异以天为单位。
然后构造输出数据帧很简单:
RESULTS <- data.frame(DATE=DATA$DATE, FIRST=first, BETWEEN=between)
答案 2 :(得分:0)
第一部分:
DATA = data.frame((c("7/8/2013", "8/1/2013", "8/30/2013", "10/23/2013","12/16/2013", "12/16/2015")))
names(DATA)[1] = "V1"
date = as.Date(DATA$V1, format="%m/%d/%Y")
print(date-date[1])
结果:
[1] 0 24 53 107 161 891
第二部分 - 只需使用for
循环
答案 3 :(得分:0)
您只需使用简单difftime
和滞后diff
计算添加每列。
DATA$FIRST <- c(0,
with(DATA,
difftime(DATE[2:length(DATE)],DATE[1], unit="days")
)
)
DATA$BETWEEN <- c(0,
with(DATA,
diff(DATE[1:(length(DATE) - 1)], unit="days")
)
)
identical(DATA, RESULTS)
[1] TRUE