Question

我有一个数据集名称历史记录，其中包含列：年，区域，售出商品的数量
我想知道哪个地区的商品销售量高于当年的平均销售量我的代码看起来像

         (history['region','year','item sold'].group-by(['year','region']).mean()))

我想掩盖所有地区的平均销售额均高于当年平均值作为该区域的年区域平均值

Answer 1

这是伪代码，您如何使用lambda函数执行此操作。 lambda函数将过滤“已售商品”值大于该组平均值的组行

history['region','year','item sold'].groupby(['year','region']).apply(lambda g:\
g[g['item sold']>g['item sold'].mean()])