计算在Python中分组的唯一值

时间:2017-03-04 01:24:05

标签: python pandas count group-by unique

我正在使用python数据库并使用pandas。目前我的数据库显示如下:

Employer        Account_Num
AAA             123
BBB             456
AAA             789
AAA             123
BBB             101
CCC             112

我可以将它放入一个计算所有Account_Num的表中,如下所示:

Employer   Account_Num
AAA        3
BBB        2
CCC        1

我使用此代码来实现上述目标:

bigdata.groupby(['Employer'])[['Account_Num']].count()

但我只需要计算唯一的Account_Num。哪个应该是这样的:

Employer   Account_Num
AAA        2
BBB        2
CCC        1

我能做到这一点的最佳方式是什么?谢谢!

1 个答案:

答案 0 :(得分:3)

您正在寻找nunique()

HikariCP

<强>演示

df.groupby('Employer').Account_Num.nunique()