Question

我有数据框，我想通过每个ID和组的总和创建一个新变量，如果我总结正常，数据维度减少，我的情况我需要保留并重复每一行。

ID <- c(rep(1,3), rep(3, 5), rep(4,4))
Group <-c(1,1,2,1,1,1,2,2,1,1,1,2)
x <- c(1:12)
y<- c(12:23)
df <- data.frame(ID,Group,x,y)
   ID Group  x  y
1   1     1  1 12
2   1     1  2 13
3   1     2  3 14
4   3     1  4 15
5   3     1  5 16
6   3     1  6 17
7   3     2  7 18
8   3     2  8 19
9   4     1  9 20
10  4     1 10 21
11  4     1 11 22
12  4     2 12 23

输出另外还有两个变量“sumx”和“sumy”。分组（ID，组）

   ID Group  x  y sumx sumy
1   1     1  1 12    3   25
2   1     1  2 13    3   25
3   1     2  3 14    3   14
4   3     1  4 15   15   48
5   3     1  5 16   15   48
6   3     1  6 17   15   48
7   3     2  7 18   15   37
8   3     2  8 19   15   37
9   4     1  9 20   30   63
10  4     1 10 21   30   63
11  4     1 11 22   30   63
12  4     2 12 23   12   23

任何想法？

Answer 1

简短：

df$sumx <- with(df,ave(x,ID,Group,FUN = sum))
df$sumy <- with(df,ave(y,ID,Group,FUN = sum))

Answer 2

我们可以使用dplyr

library(dplyr)
df %>%
   group_by(ID, Group) %>%
   mutate_each(funs(sum)) %>%
   rename(sumx=x, sumy=y) %>%
   bind_cols(., df[c("x", "y")])

如果sum只有两列，那么

df %>%
    group_by(ID, Group) %>%
    mutate(sumx = sum(x), sumy = sum(y))

Answer 3

如果是单列，则可以使用下面的代码获取所需内容；如果列数超过1，则相应地添加：

library(dplyr)

data13 <- data12 %>%

  group_by(Category) %>%

  mutate(cum_Cat_GMR = cumsum(GrossMarginRs))

组的总和但是对于r中的每一行保持相同的值

3 个答案: