组内的累积最小值

时间:2019-02-01 16:50:56

标签: r data-manipulation

我正在寻找帮助来计算R中给定组内的滚动最小值。我有一个带有组标识符和目标变量的数据集,我想创建一个新变量来遍历每个组,并给出该组中所有先前行的目标变量的最小值。

我当前的数据框:

Group <- c('A', 'A', 'A','A', 'B', 'B', 'B', 'B') 
Target <- c(1, 0, 5, 0, 3, 5, 1, 3) 
data <- data.frame(cbind(Group, Target))

我想要的数据框:

Desired.Variable <- c(1, 0, 0, 0, 3, 3, 1, 1)
data <- data.frame(cbind(Group, Target, Desired.Variable))

对此将提供任何帮助!

1 个答案:

答案 0 :(得分:1)

我们可以按组使用cummin功能

data$output <- with(data, ave(Target, Group, FUN = cummin))

data
#  Group Target output
#1     A      1      1
#2     A      0      0
#3     A      5      0
#4     A      0      0
#5     B      3      3
#6     B      5      3
#7     B      1      1
#8     B      3      1

相当于dplyrdata.table

library(dplyr)
data %>%
  group_by(Group) %>%
  mutate(output = cummin(Target))

library(data.table)
setDT(data)[, output := cummin(Target), by = (Group)]