我有一个具有以下格式的表(Pandas DataFrame):
IdPar | IdPre | IdClas
--------------------------
10 5 5
10 1 5
10 1 5
11 2 1
11 2 1
11 3 1
因此,每一行都是一个观察值,其中我有一个IdPar,它具有两个值,一个IdPre(分类中的期望值)和一个IdClass(属于IdPar的实际值)。我对Everi IdPar有数百个观察结果。
我需要做的是计算组合的数量(IdPar和IdPre,也保留IdClas),这样我就可以得到这样的东西:
IdPar | IdPre | IdClas | Count
--------------------------
10 5 5 1
1 5 2
11 2 1 2
3 1 1
我很高兴通过以下代码行获得该输出:
agg = df.groupby(['IdPar', 'IdPre', 'IdClas']).agg({'IdPre': ['count']})
但是现在我需要获取另一个表,该表只保留每个包裹的最高计数。我正在尝试许多聚合组合,但没有用。
输出应类似于:
IdPar | IdPre | IdClas | Count
--------------------------
10 1 5 2
11 2 1 2
亲切的问候