假设我有一个看起来像这样的df
ID X_Value
1 40
2 13
3 75
4 83
5 64
6 43
7 74
8 45
9 54
10 84
所以我想做的是做一个滚动函数,如果在实际的最后4行中,有2个或多个比X高的值(在本例中为70),然后返回1,否则为0。
所以输出将类似于以下内容:
ID X_Value Next_4_2
1 40 0
2 13 0
3 75 0
4 83 1
5 64 1
6 43 1
7 24 1
8 45 0
9 74 0
10 84 1
我认为这可以通过滚动功能来实现,但是我已经尝试过并且不确定如何做到这一点。预先谢谢你
答案 0 :(得分:3)
鉴于您的预期输出,我想您的意思是“在实际的和前3行中”。然后使用一些滚动功能确实可以完成这项工作:
library(zoo)
thr1 <- 70
thr2 <- 2
last <- 3 + 1
df$Next_4_2 <- 1 * (rollsum(df$X_Value > thr1, last, align = "right", fill = 0) >= thr2)
df
# ID X_Value Next_4_2
# 1 1 40 0
# 2 2 13 0
# 3 3 75 0
# 4 4 83 1
# 5 5 64 1
# 6 6 43 1
# 7 7 74 1
# 8 8 45 0
# 9 9 54 0
# 10 10 84 1
答案 1 :(得分:0)
使用max(1,i-3)
进行索引也许是代码中唯一值得记住的部分。当确实需要for循环时,我可能会为后续的构建提供帮助。
dat$X_Next_4_2 <- integer( length(dat$X_Value) )
dat$ X_Next_4_2[1]=0
for (i in 2:length(dat$X_Value) ){
dat$ X_Next_4_2[i]=
( sum(dat$X_Value[i: (max(0, i-4) )] >=70) >=2 )}
(不是很漂亮,明显不如已经发布的rollsum答案。)