Question

df = pd.DataFrame({'a': [1,1,1,2,2], 'b':[10,10,20,30,30], 'c':[5,7,7,11,17]})
df.groupby('a').groupby(['b', 'c']).ngroups

它会抛出AttributeError。

Answer 1

您不需要双重分组依据：将 drop_duplicates 与 ['b', 'c'] 用作子集，仅保留唯一的行，然后进行分组依据'a'并使用 size ：

df.drop_duplicates(['b', 'c']).groupby('a').size()

a
1    3
2    2
dtype: int64

Answer 2

您需要对第一次分组的结果应用一个函数：

df.groupby('a').apply(lambda x: x.groupby(['b', 'c']).ngroups)
#a
#1    3
#2    2