将MEAN()应用于DF的组

时间:2015-09-08 03:18:43

标签: python group-by apply mean

我有一个大型数据框,代表属于不同产品组的产品分数。

我需要:

  1. 按beer_style

  2. 对所有行进行分组
  3. 对于每个beer_style计算该风格的平均值

  4. 对于每个beer_style:从每个产品组的元素(啤酒)中减去此特定样式的平均值。结果(Value - Mean)将替换原始值(不需要额外的列)

  5. 这是我试过的东西

        def normalize(group):  # Normalize each group - elements same beer_style
           group.review_overall -= group.review_overall.mean()
           group.review_aroma -= group.review_aroma.mean()
           group.review_appearance -= group.review_appearance.mean()
           group.review_palate -= group.review_palate.mean()
           group.review_taste -= group.review_taste.mean()
           return group
       df = df.groupby('beer_style').apply(normalize) 
       df.describe()
    

    我得到了表格,但数字看起来很可疑(5个参数的所有MEAN值(见上文)非常接近于零)

    我不确定我是否正确编码了我的目标。

    请帮助

0 个答案:

没有答案