Question

输入：

dfB=dfA.groupby('labelA').labelB.nlargest(3)

输出：

labelA      
G       5309   415004880.00
        6016   268492764.00
        5570   191452396.00
PG      6687   486295561.00
        5943   400738009.00
        5987   368061265.00
PG-13   6380   936662225.00
        6391   652270625.00
        5723   623357910.00
R       6616   363070709.00
        6184   350126372.00
        5569   254464305.00
Name: labelB, dtype: float64

我现在想创建一个新的数据框，可以对其可视化，其中包含每个组（G，PG，PG-13，R）的平均值。我尝试了以下操作，但是，如下所示，输出是所有4组组合的平均值。

输入：

barB.mean()

输出：

442499751.75

Answer 1

dfB = dfA.groupby('labelA').labelB.apply(lambda x: x.nlargest(3).mean())

您可以使用apply将均值函数链接到最大。

如何使用已分组的另一个数据框的产品来创建新的数据框？

1 个答案: