需要帮助取消数据框分组

时间:2019-07-22 23:47:19

标签: r

我有一个用于分组的数据集,现在我试图将原来需要合并的行扩展回去以进行过滤。该数据是按销售日期划分的一组销售点。每个销售点都有一行,但是同一类型的商品有许多不同的销售点。因此,我按项目分组以获取重要信息,例如总销售额和平均销售价格等。现在,在筛选并找到具有正确销售频率等的项目之后,我需要对数据进行分组以查看全部销售点。我尝试使用“ ungroup()”,但是它不起作用或者我做对了。

top25000 <- read_csv("index_sales_export.csv")
blue_chip_index <- top25000 %>%
  select(graded_title,date,price,vcp_card_grade_id) %>%
  filter(date >= as.Date("2018-07-08")) %>%
  group_by(graded_title) %>%
   summarise(Market_Cap = sum(price),Average_Price = mean(price),VCP_Card_Grade_ID = mean(vcp_card_grade_id),count=n())%>%
  filter(Market_Cap >= 10000 & count >= 25)%>%
  rename(Total_Number_of_Sales = count)%>%
blue_chip_index

1 个答案:

答案 0 :(得分:0)

如果我了解您想要的内容,听起来您应该再次从原始数据框开始,然后筛选所需的项目。

取消对新数据框的分组将不允许您对其进行汇总。

这是否实现了您想要的:

图书馆(tidyverse)

top25000 <- read_csv("index_sales_export.csv")
blue_chip_index <- top25000 %>%
  select(graded_title,date,price,vcp_card_grade_id) %>%
  filter(date >= as.Date("2018-07-08")) %>%
  group_by(graded_title) %>%
  summarise(Market_Cap = sum(price),
            Average_Price = mean(price),
            VCP_Card_Grade_ID = mean(vcp_card_grade_id),
            count=n())%>%
  filter(Market_Cap >= 10000 & count >= 25) %>%
  rename(Total_Number_of_Sales = count)


top25000 %>% 
  filter(graded_title %in% blue_chip_index$graded_title)