总结数据框中的独特组合

时间:2013-03-25 11:57:38

标签: r

在下面的示例数据集中,我需要找到每年汇总的每个产品的唯一客户数量。输出必须是带有标题的data.frame:年 - 产品 - 客户数量

感谢您的帮助。

year <- c("2009", "2010")
product <- c("a", "b", "c")
df <- data.frame(customer = sample(letters, 50, replace = T),
                 product = sample(product, 50, replace = T),
                 year = sample(year, 50, replace = T))

2 个答案:

答案 0 :(得分:4)

使用aggregate()(在包含R的统计信息包中):

agdf<-aggregate(customer~product+year,df,function(x)length(unique(x)))
agdf
#  product year customer
#1       a 2009        7
#2       b 2009        8
#3       c 2009       10
#4       a 2010        7
#5       b 2010        7
#6       c 2010        6

答案 1 :(得分:2)

使用plyr的{​​{1}}:

summarise