我想循环时间间隔并标记区间内的观察结果。此外,我希望解决方案能够灵活地设置间隔长度。到目前为止,我设法做到了。像:
set.seed(1)
data=data.frame(start_year=sample(2007:2017,100,TRUE),start_month=sample(1:12,100,TRUE))
window_length=2
month=6
iteration_variable=2
end_horizon=2007+window_length+iteration_variable
start_horizon=2007+iteration_variable
data$period=ifelse( (data$start_year<=end_horizon & data$start_month<=month ) & (start_horizon<=data$start_year & month<=data$start_month ),1,0)
我希望有一个更优雅的版本,但回想一下,我不想使用caret
,因为我需要在每个折叠中结合多个估计并执行复杂的计算。
答案 0 :(得分:0)
如果将年份和月份转换为"yearmon"
课程,则可以进行直接比较:
library(zoo)
to_ym <- function(y, m) as.yearmon(y + (m-1)/12)
ym <- with(data, to_ym(start_horizon, start_month))
st <- to_ym(start_horizon, month)
en <- to_ym(end_horizon, month) ##
period <- (ym >= st & ym <= en) + 0
另外,如果en
是st
之后已知的年数,就像它在2的问题那样,那么我们可以写一下:
en <- st + 2
而不是标记为##的行(类似地,如果它是已知的年数和月数,例如2 + 6/12 = 2.5,2年和6个月)。