我有一个由groupby生成的熊猫系列,看起来像这样:
CustomerID InvoiceDate
12346.0 2011-01-18 10:01:00 1
12347.0 2011-10-31 12:25:00 47
2010-12-07 14:57:00 31
2011-01-26 14:30:00 29
2011-04-07 10:43:00 24
..
18283.0 2011-07-14 13:20:00 1
2011-11-10 15:07:00 1
18287.0 2011-10-12 10:23:00 38
2011-05-22 10:39:00 29
2011-10-28 09:29:00 3
我想找出哪个客户ID的唯一发票日期最多。
我尝试使用value_counts()
和size()
执行groupby,但是它们都不给我想要的输出。我希望输出格式像这样:
CustomerID UniqueInvoiceDates
12346.0 1
12347.0 4
...
感谢您的帮助!
答案 0 :(得分:1)
假设CustomerID
是索引:
df.groupby(level=0)['InvoiceDate'].nunique()
CustomerID
12346.0 1
12347.0 4
18283.0 2
18287.0 3
Name: InvoiceDate, dtype: int64