我是数据科学领域的初学者。我试图对数据进行一些聚合,但不确定如何编码。 我有以下数据框架。我需要知道如何计算驱动程序完成的工作总数(驱动程序ID是唯一的)
df = data.groupby(['dr_status','No_of_jobs']).size()
如何调整以便我可以看到如下输出?
Diver_ID - Total_Jobs
53028 - 45
53051 - 20
答案 0 :(得分:0)
sum
No_of_jobs和groupby
驱动程序ID应该完成这项工作
data.groupby('Driver_Id')['No_of_jobs'].sum()
另一个选项是pivot_table
aggfunc=['count']
:
df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])