熊猫+汇总+总数

时间:2018-10-10 19:22:29

标签: python pandas count aggregate pandas-groupby

想象一下,我有一个包含员工销售信息的表。现在,我主要对每个员工有多少销售/客户感兴趣。我对总数(员工出售给多少客户)和唯一计数(员工出售给多少唯一客户)既感兴趣。为此,我正在查看Employee_id数据集中的Customer_idSales列(尽管也有其他列)。他们看起来像这样:

  | Employee_id | Customer_id
 1|      'E122' |      'C921' ...
 2|      'E122' |      'C221' ...
 3|      'E43'  |      'C365' ...
 4|      'E122' |      'C221' ...
 5|      'E57'  |      'C138' ...
 ...

两列均包含表示ID的字符串。现在,我有以下内容,但是得到了一个'int'对象不是可调用错误,而且我也不知道为什么。

Sales.groupby('Employee_id').agg({
'counts': [
    ('Customer_id', count)
]})

我不确定我在做什么错以及与'int'相关的错误来自何处。我通常会看到诸如summax之类的聚合函数,但对于count而言却不是那么多,所以这可能是个问题。另外,如果我也想计算不重复的客户,我该怎么做?

感谢您的帮助!

0 个答案:

没有答案
相关问题