我有一个数据框,其中包含id和启动日期,对于每个我想知道每个发布日期的日期范围(Time_Seq)的数据框。
日期向量如下:
data:
ID LAUNCH_DATE
1 50314486 2004-01-01
2 55842774 2004-01-27
我有一个包含不同数据范围的时间序列数据帧:
head(Time_Table):
Time_Seq DateFrom DateTo
1 726 2003-12-29 2004-01-04
2 727 2004-01-05 2004-01-11
3 728 2004-01-12 2004-01-18
4 729 2004-01-19 2004-01-25
5 730 2004-01-26 2004-02-01
6 731 2004-02-02 2004-02-08
理想情况下,我希望输出看起来像:
ID LAUNCH_DATE Time_Seq
1 50314486 2004-01-01 726
2 55842774 2004-01-27 731
目前我可以用一个非常简短的方式解决这个问题:
Time_Table$Time_Seq[which( (date$LAUNCH_DATE[1]>=Time_Table$DATEFROM)&(date$LAUNCH_DATE[1]<=Time_Table$DATETO) )]
任何人都可以建议一种更简单的方法,而不必以这种方式循环吗?
答案 0 :(得分:2)
我只想在interval
包中使用%within%
和lubridate
:
library(lubridate)
# create intervals
interval <- with(Time_Table, new_interval(ymd(DateFrom), ymd(DateTo)))
# for each LAUNCH_DATE, test whether it falls within an interval, and pick corresponding Time_Seq
data$Time_Seq <- sapply(data$LAUNCH_DATE, function(x) Time_Table$Time_Seq[ymd(x) %within% interval])
答案 1 :(得分:1)
用于将连续变量切割为类别的cut
函数适用于日期。
data$Time_Seq <- cut(
data$LAUNCH_DATE,
c(Time_Table$DateFrom, Time_Table$DateTo[nrow(Time_Table)]),
labels = Time_Table$Time_Seq,
right = FALSE
)