根据新创建的列的先前值填充新列

时间:2018-10-18 09:02:45

标签: r dplyr lag

我有一个包含2列的现有数据框。我想根据这些规范创建第三列:

s的当前值 = s的先前值 + [s的先前值* X2的当前值]

我设法进行了一些计算,这些计算基于其他两列作为测试来填充。当然,这不会根据自己的先前值进行计算。

library(dplyr)
set.seed(123)
a <- data.frame(replicate(2,sample(1:10,10,rep = TRUE)))
a %>% mutate(s = lag(X1, default = 1) +lag(X1, default = 1) * X2)

   X1 X2   s
1   3 10  11
2   8  5  18
3   5  7  64
4   9  6  35
5  10  2  27
6   1  9 100
7   6  3   4
8   9  1  12
9   6  4  45
10  5 10  66

理想情况下,我需要这样的东西:

library(dplyr)
set.seed(123)
a <- data.frame(replicate(2,sample(1:10,10,rep = TRUE)))
a %>% mutate(s = lag(s, default = 1) +lag(s, default = 1) * X2)

   X1 X2   s
1   3 10  11
2   8  5  66
3   5  7  528
4   9  6  3696

但这会导致出现问题,因为s未定义。

任何建议都非常感谢。

关于, 阿克塞尔

1 个答案:

答案 0 :(得分:1)

然后使用for循环是不错的时间

a$s <- 0
for (i in 1:nrow(a)) {
  if (i == 1) 
    a$s[i] = a$X2[i] + 1
  else
    a$s[i] = a$s[i-1] + (a$s[i-1] * a$X2[i])
}


a
#   X1 X2        s
#1   3 10       11
#2   8  5       66
#3   5  7      528
#4   9  6     3696
#5  10  2    11088
#6   1  9   110880
#7   6  3   443520
#8   9  1   887040
#9   6  4  4435200
#10  5 10 48787200