我想更新表中的值,包含上一行的值,在组内,(并且可能会停止给定条件下的更新)
以下是一个例子:
set.seed(12345)
field <- data.table(time=1:3, player = letters[1:2], prospects = round(rnorm(6),2))
setkey(field, player, time)
field[time == 1, energy := round(rnorm(2),2)] #initial level - this is what I want to propagate down the table
#let 'prospects < 0.27' be the condition that stops the process, and sets 'energy = 0'
#player defines the groups within which the updates are made
这是我的表格。
> field
time player prospects energy
1: 1 a 0.81 -0.32
2: 2 a 0.25 NA
3: 3 a 2.05 NA
4: 1 b 1.63 -1.66
5: 2 b 2.20 NA
6: 3 b 0.49 NA
这是我想要的表格。
> field
time player prospects energy
1: 1 a 0.81 -0.32
2: 2 a 0.25 0
3: 3 a 2.05 0
4: 1 b 1.63 -1.66
5: 2 b 2.20 -1.66
6: 3 b 0.49 -1.66
提前致谢
答案 0 :(得分:2)
可能有更好的方法,但这是我想到的。这使用roll=TRUE
参数。我们的想法是首先将energy=0.0
设置为prospects < 0.27
:
field[prospects < 0.27, energy := 0.0]
然后,如果我们从field
中移除NA值,我们可以通过对所有组合进行连接来使用roll=TRUE
,如下所示:
field[!is.na(energy)][CJ(c("a", "b"), 1:3), roll=TRUE][, prospects := field$prospects][]
# player time prospects energy
# 1: a 1 0.81 0.63
# 2: a 2 0.25 0.00
# 3: a 3 2.05 0.00
# 4: b 1 1.63 -0.28
# 5: b 2 2.20 -0.28
# 6: b 3 0.49 -0.28
我们要重置prospects
,因为roll
也会更改它。你可以做得更好,但你明白了。
变体,因此仅在energy
列上执行滚动:
field[!is.na(energy)][CJ(c("a", "b"), 1:3), list(energy),
roll=TRUE][, prospects := field$prospects][]
或者使用包na.locf
中的zoo
可能更简单:
field[time == 1, energy := round(rnorm(2),2)]
field[prospects < 0.27, energy := 0.0]
require(zoo)
field[, energy := na.locf(energy, na.rm=FALSE)]
如果每组的第一行保证是非NA的,那么它就可以工作了。但如果没有,你也可以按组运行na.locf:
field[, energy := na.locf(energy, na.rm=FALSE), by=player]
答案 1 :(得分:0)
这样的事情?
ddply(field, 'player', function(x) {
baseline <- x[x$time == 1, 'energy']
x$energy <- baseline
ind <- which(x$prospects < 0.27)
if (length(ind)) {
x[min(ind):nrow(x), 'energy'] <- 0
}
x
})