我有一个数据集名称历史记录,其中包含列:年,区域,售出商品的数量
我想知道哪个地区的商品销售量高于当年的平均销售量
我的代码看起来像
(history['region','year','item sold'].group-by(['year','region']).mean()))
我想掩盖所有地区的平均销售额均高于当年平均值 作为该区域的年区域平均值
答案 0 :(得分:0)
这是伪代码,您如何使用lambda函数执行此操作。 lambda函数将过滤“已售商品”值大于该组平均值的组行
history['region','year','item sold'].groupby(['year','region']).apply(lambda g:\
g[g['item sold']>g['item sold'].mean()])