计算满足R中条件的下n行

时间:2018-11-10 00:41:46

标签: r rolling-computation

假设我有一个看起来像这样的df

ID    X_Value
1      40
2      13
3      75
4      83
5      64
6      43
7      74
8      45
9      54
10     84

所以我想做的是做一个滚动函数,如果在实际的最后4行中,有2个或多个比X高的值(在本例中为70),然后返回1,否则为0。

所以输出将类似于以下内容:

ID    X_Value  Next_4_2
1      40        0
2      13        0
3      75        0
4      83        1
5      64        1
6      43        1
7      24        1
8      45        0
9      74        0
10     84        1

我认为这可以通过滚动功能来实现,但是我已经尝试过并且不确定如何做到这一点。预先谢谢你

2 个答案:

答案 0 :(得分:3)

鉴于您的预期输出,我想您的意思是“在实际的和前3行中”。然后使用一些滚动功能确实可以完成这项工作:

library(zoo)
thr1 <- 70
thr2 <- 2
last <- 3 + 1
df$Next_4_2 <- 1 * (rollsum(df$X_Value > thr1, last, align = "right", fill = 0) >= thr2)
df
#    ID X_Value Next_4_2
# 1   1      40        0
# 2   2      13        0
# 3   3      75        0
# 4   4      83        1
# 5   5      64        1
# 6   6      43        1
# 7   7      74        1
# 8   8      45        0
# 9   9      54        0
# 10 10      84        1

答案 1 :(得分:0)

使用max(1,i-3)进行索引也许是代码中唯一值得记住的部分。当确实需要for循环时,我可能会为后续的构建提供帮助。

dat$X_Next_4_2 <- integer( length(dat$X_Value) )
dat$ X_Next_4_2[1]=0
for (i in 2:length(dat$X_Value) ){ 
          dat$ X_Next_4_2[i]= 
            ( sum(dat$X_Value[i: (max(0, i-4) )] >=70) >=2 )}

(不是很漂亮,明显不如已经发布的rollsum答案。)