Question

我有一个数据框CGdf_2004，如下所示：

Region,   Sector,   TSR_15_16
Europe    Consumer  12%
Americas  Telecom   15%
...so on 7000 rows

我已经按扇区和地区计算出平均TSR_15_16分组。

X = CGdf_2004.groupby(['Region', 'Sector']).mean()

现在，我想在CGdf_2004中创建一个新列，该列具有基于扇区和地区的方法。因此，我希望将“欧洲”和“消费者”并列的每一行的均值（“欧洲和消费者”）写入新列。

关于如何做到这一点的任何建议？

Answer 1

您应该使用join。

onCreate()

一行

X=CGdf_2004.groupby(['Region', 'Sector']).mean()
CGdf_2004.join(X, on=['Region', 'Sector'], rsuffix='_mean')

Answer 2

如果我了解您：

CGdf_2004['mean'] = CGdf_2004.groupby(['Region', 'Sector']).transform('mean')