下午好,亲爱的社区,
我在R语言中还很陌生,所以如果我对问题的描述还不够精确或具体,请原谅我。
我有一个包含两列的数据框。第一个是ID,第二个是购买日期。但是,某些ID在一个“日期”期间出现的频率更高,我想总结一下ID和“日期”,而第三列(“购买量”)则反映了购买的数量。 ID and Purchase Date
非常感谢。
答案 0 :(得分:0)
有一个名为dplyr的R软件包,它使这种聚合非常容易。您可以使用几行代码来汇总数据。
library(dplyr)
results <- df %>%
group_by(ID, Date) %>%
summarise(numPurchases = n(),
totalPurchases = sum(Quantity))
df将是您的输入数据。您的结果将具有“ ID”和“日期”列,以及一个新列,该新列计算每个日期每个ID的销售数量(numPurchases),以及一个新列,显示每个日期每个ID的购买总数(totalPurchases)。希望有帮助。