输入:
dfB=dfA.groupby('labelA').labelB.nlargest(3)
输出:
labelA
G 5309 415004880.00
6016 268492764.00
5570 191452396.00
PG 6687 486295561.00
5943 400738009.00
5987 368061265.00
PG-13 6380 936662225.00
6391 652270625.00
5723 623357910.00
R 6616 363070709.00
6184 350126372.00
5569 254464305.00
Name: labelB, dtype: float64
我现在想创建一个新的数据框,可以对其可视化,其中包含每个组(G,PG,PG-13,R)的平均值。我尝试了以下操作,但是,如下所示,输出是所有4组组合的平均值。
输入:
barB.mean()
输出:
442499751.75
答案 0 :(得分:0)
dfB = dfA.groupby('labelA').labelB.apply(lambda x: x.nlargest(3).mean())
您可以使用apply
将均值函数链接到最大。