Question

我正在使用python数据库并使用pandas。目前我的数据库显示如下：

Employer        Account_Num
AAA             123
BBB             456
AAA             789
AAA             123
BBB             101
CCC             112

我可以将它放入一个计算所有Account_Num的表中，如下所示：

Employer   Account_Num
AAA        3
BBB        2
CCC        1

我使用此代码来实现上述目标：

bigdata.groupby(['Employer'])[['Account_Num']].count()

但我只需要计算唯一的Account_Num。哪个应该是这样的：

Employer   Account_Num
AAA        2
BBB        2
CCC        1

我能做到这一点的最佳方式是什么？谢谢！

Answer 1

您正在寻找nunique()。

HikariCP

<强>演示

df.groupby('Employer').Account_Num.nunique()