Question

我有一个大型数据框，代表属于不同产品组的产品分数。

我需要：

按beer_style
对于每个beer_style计算该风格的平均值
对于每个beer_style：从每个产品组的元素（啤酒）中减去此特定样式的平均值。结果（Value - Mean）将替换原始值（不需要额外的列）

这是我试过的东西

    def normalize(group):  # Normalize each group - elements same beer_style
       group.review_overall -= group.review_overall.mean()
       group.review_aroma -= group.review_aroma.mean()
       group.review_appearance -= group.review_appearance.mean()
       group.review_palate -= group.review_palate.mean()
       group.review_taste -= group.review_taste.mean()
       return group
   df = df.groupby('beer_style').apply(normalize) 
   df.describe()

我得到了表格，但数字看起来很可疑（5个参数的所有MEAN值（见上文）非常接近于零）

我不确定我是否正确编码了我的目标。

请帮助

将MEAN（）应用于DF的组

0 个答案: