我在DataFrame中有2列,我正在寻找Python中的以下解决方案。
我的数据框当前看起来像这样:
columns: INDUSTRY Revenue
Service 100
Manufacturing 50
Service 200
Manufacturing 100
Public 60
我想拥有的是DataFrame中每种Industry类型的平均值:
columns: INDUSTRY Revenue
Service 150
Manufacturing 75
Public 60
我知道如何在R中使用函数表执行此操作,但我只是从python开始。谢谢
答案 0 :(得分:2)
在python中,它称为groupby,因为您的数据帧称为Industry,因此您必须使用:
Industry.groupby('Industry')['Revenue'].mean()
关于stackoverflow的几个示例:Pandas group-by and sum