如何使用已分组的另一个数据框的产品来创建新的数据框?

时间:2018-10-27 12:01:43

标签: python-3.x dataframe

输入:

dfB=dfA.groupby('labelA').labelB.nlargest(3)

输出:

labelA      
G       5309   415004880.00
        6016   268492764.00
        5570   191452396.00
PG      6687   486295561.00
        5943   400738009.00
        5987   368061265.00
PG-13   6380   936662225.00
        6391   652270625.00
        5723   623357910.00
R       6616   363070709.00
        6184   350126372.00
        5569   254464305.00
Name: labelB, dtype: float64

我现在想创建一个新的数据框,可以对其可视化,其中包含每个组(G,PG,PG-13,R)的平均值。我尝试了以下操作,但是,如下所示,输出是所有4组组合的平均值。

输入:

barB.mean()

输出:

442499751.75

1 个答案:

答案 0 :(得分:0)

dfB = dfA.groupby('labelA').labelB.apply(lambda x: x.nlargest(3).mean())

您可以使用apply将均值函数链接到最大。