如何使用groupby和sum

时间:2020-04-13 13:50:53

标签: python pandas sum

我正在处理一个数据帧,必须对它进行分组和求和。我的阅读方式是我必须首先分组,然后选择要汇总的列。先使用groupby,然后选择我要求和的列,再选择我要首先求和的列,然后再使用groupby,有什么区别。

grouped_df = df.groupby('Manager')[['Transaction', 'Defects']].sum()

grouped_df = df[['Transaction','Defects']].groupby('Manager').sum()

上面的代码是相同的还是有时会产生不同的结果。

1 个答案:

答案 0 :(得分:2)

grouped_df = df[['Transaction','Defects']].groupby('Manager').sum() 

将产生错误,因为数据帧df [['Transaction','Defects']]中未包含'Manager'。

第一行是正确的。

就我个人而言,我更喜欢使用agg方法进行分组,您应该看一下。您可以使用不同的聚合功能。例如:

grouped_df = df.groupby('Manager').agg({'Transaction': 'sum','Defects': 'mean'})
相关问题