找到dplyr mutate内的cummax指数?

时间:2015-07-20 20:45:01

标签: r dplyr

我有以下代码:

library(dplyr)
set.seed(10)
test<-data.frame(x=runif(10,0,1),y=rep(c(1,2),5))
test <- test %>%
  group_by(y) %>%
  mutate(max_then=cummax(x))

test

输出

Source: local data frame [10 x 3]
Groups: y

            x y  max_then
1  0.50747820 1 0.5074782
2  0.30676851 2 0.3067685
3  0.42690767 1 0.5074782
4  0.69310208 2 0.6931021
5  0.08513597 1 0.5074782
6  0.22543662 2 0.6931021
7  0.27453052 1 0.5074782
8  0.27230507 2 0.6931021
9  0.61582931 1 0.6158293
10 0.42967153 2 0.6931021

我想添加另一个变异列,它将添加从中计算max_then的rownumber / index。我想它会像下面这样。但我无法真正发挥作用。

test %>%
 group_by(y) %>%
     mutate(max_then-cummax(x),
            max_index=which(.$x==max_then))

预期输出为:

            x y  max_then max_index
1  0.50747820 1 0.5074782         1
2  0.30676851 2 0.3067685         2
3  0.42690767 1 0.5074782         1
4  0.69310208 2 0.6931021         4
5  0.08513597 1 0.5074782         1
6  0.22543662 2 0.6931021         4
7  0.27453052 1 0.5074782         1
8  0.27230507 2 0.6931021         4
9  0.61582931 1 0.6158293         9
10 0.42967153 2 0.6931021         4

有什么建议吗?我只是好奇,看看是否可以在mutate()语句中执行此操作。我可以在mutate()语句之外完成。

1 个答案:

答案 0 :(得分:10)

我只会匹配x

中的唯一实例
test %>%
  mutate(max_index = match(max_then, unique(test$x)))
# Source: local data frame [10 x 4]
# Groups: y
# 
#              x y  max_then max_index
#  1  0.50747820 1 0.5074782         1
#  2  0.30676851 2 0.3067685         2
#  3  0.42690767 1 0.5074782         1
#  4  0.69310208 2 0.6931021         4
#  5  0.08513597 1 0.5074782         1
#  6  0.22543662 2 0.6931021         4
#  7  0.27453052 1 0.5074782         1
#  8  0.27230507 2 0.6931021         4
#  9  0.61582931 1 0.6158293         9
#  10 0.42967153 2 0.6931021         4