如何通过比较熊猫的两列进行分组

时间:2020-05-25 19:44:01

标签: python python-3.x pandas dataframe group-by

具有列名和exm_date的df

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   

tom    244    2020-03-05 11:48:03.166              
mark   242    2019-03-05 11:48:03.166    

如何通过比较姓名和名册来获取最小日期。如果滚动不同,则应将其视为单独的记录

expected_output

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   
tom    244    2020-03-05 11:48:03.166   

为了比较一列(名称)与我正在使用的日期:

df=df.groupby('name')['exm_date'].min().reset_index()

尝试了这个:

df=df.groupby('name','roll')['exm_date'].min().reset_index()

1 个答案:

答案 0 :(得分:2)

您在[]子句中缺少方括号(groupby):

执行此操作:

df = df.groupby(['name','roll'])['exm_date'].min().reset_index()