使用pandas分析数据集

时间:2018-06-08 10:52:34

标签: pandas

我是数据科学领域的初学者。我试图对数据进行一些聚合,但不确定如何编码。 我有以下数据框架。我需要知道如何计算驱动程序完成的工作总数(驱动程序ID是唯一的)

 

df = data.groupby(['dr_status','No_of_jobs']).size()

如何调整以便我可以看到如下输出?

Diver_ID -  Total_Jobs

53028  - 45

53051  - 20 

1 个答案:

答案 0 :(得分:0)

sum No_of_jobs和groupby驱动程序ID应该完成这项工作

data.groupby('Driver_Id')['No_of_jobs'].sum()

另一个选项是pivot_table aggfunc=['count']

df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])