想象一下,我有一个包含员工销售信息的表。现在,我主要对每个员工有多少销售/客户感兴趣。我对总数(员工出售给多少客户)和唯一计数(员工出售给多少唯一客户)既感兴趣。为此,我正在查看Employee_id
数据集中的Customer_id
和Sales
列(尽管也有其他列)。他们看起来像这样:
| Employee_id | Customer_id
1| 'E122' | 'C921' ...
2| 'E122' | 'C221' ...
3| 'E43' | 'C365' ...
4| 'E122' | 'C221' ...
5| 'E57' | 'C138' ...
...
两列均包含表示ID的字符串。现在,我有以下内容,但是得到了一个'int'对象不是可调用错误,而且我也不知道为什么。
Sales.groupby('Employee_id').agg({
'counts': [
('Customer_id', count)
]})
我不确定我在做什么错以及与'int'相关的错误来自何处。我通常会看到诸如sum
和max
之类的聚合函数,但对于count
而言却不是那么多,所以这可能是个问题。另外,如果我也想计算不重复的客户,我该怎么做?
感谢您的帮助!