汇总R中的数据

时间:2019-10-28 22:42:00

标签: r dplyr

我有一个如下所示的数据集:

library(tidyverse)
data <- tribble(
  ~category, ~product_id, 
  "A",         10, 
  "B",         20,    
  "C",         30, 
  "A",         10, 
  "A",         10, 
  "B",         20, 
  "C",         30, 
  "A",         10, 
  "A",         10, 
  "B",         20, 
)

现在,我想按“类别”变量将其分组,保留“ product_id”并添加一个新的变量来计算类别:

  aggregated_data <- tribble(
  ~category, ~product_id, ~numberOfcategory
  "A",         10,       5,
  "B",         20,       3,   
  "C",         30,       2,
)

我已经获得了带有以下代码的“ numberOfcategory”:

data %>%
  group_by(category) %>%
  tally(sort=TRUE) 

但是以某种方式我无法保留product_id。

有人可以帮助我获取数据框(aggregated_data)吗?提前致谢。

1 个答案:

答案 0 :(得分:1)

您接近了!还要按product_id进行分组,如下所示:

data %>%
  group_by(category,product_id) %>%
  tally(sort=TRUE)