带值屏蔽的分组方式

时间:2019-10-19 07:00:49

标签: python pandas group-by mask

我有一个数据集名称历史记录,其中包含列:年,区域,售出商品的数量
我想知道哪个地区的商品销售量高于当年的平均销售量 我的代码看起来像

         (history['region','year','item sold'].group-by(['year','region']).mean()))

我想掩盖所有地区的平均销售额均高于当年平均值 作为该区域的年区域平均值

1 个答案:

答案 0 :(得分:0)

这是伪代码,您如何使用lambda函数执行此操作。 lambda函数将过滤“已售商品”值大于该组平均值的组行

history['region','year','item sold'].groupby(['year','region']).apply(lambda g:\
g[g['item sold']>g['item sold'].mean()])