在下面的示例数据集中,我需要找到每年汇总的每个产品的唯一客户数量。输出必须是带有标题的data.frame:年 - 产品 - 客户数量
感谢您的帮助。
year <- c("2009", "2010")
product <- c("a", "b", "c")
df <- data.frame(customer = sample(letters, 50, replace = T),
product = sample(product, 50, replace = T),
year = sample(year, 50, replace = T))
答案 0 :(得分:4)
使用aggregate()
(在包含R的统计信息包中):
agdf<-aggregate(customer~product+year,df,function(x)length(unique(x)))
agdf
# product year customer
#1 a 2009 7
#2 b 2009 8
#3 c 2009 10
#4 a 2010 7
#5 b 2010 7
#6 c 2010 6
答案 1 :(得分:2)
使用plyr
的{{1}}:
summarise