我有一个大型数据框,代表属于不同产品组的产品分数。
我需要:
按beer_style
对于每个beer_style计算该风格的平均值
对于每个beer_style:从每个产品组的元素(啤酒)中减去此特定样式的平均值。结果(Value - Mean)将替换原始值(不需要额外的列)
这是我试过的东西
def normalize(group): # Normalize each group - elements same beer_style
group.review_overall -= group.review_overall.mean()
group.review_aroma -= group.review_aroma.mean()
group.review_appearance -= group.review_appearance.mean()
group.review_palate -= group.review_palate.mean()
group.review_taste -= group.review_taste.mean()
return group
df = df.groupby('beer_style').apply(normalize)
df.describe()
我得到了表格,但数字看起来很可疑(5个参数的所有MEAN值(见上文)非常接近于零)
我不确定我是否正确编码了我的目标。
请帮助