具有列名和exm_date的df
name roll exm_date
tom 242 2019-03-05 11:48:03.166
mark 244 2018-03-05 11:48:03.166
tom 244 2020-03-05 11:48:03.166
mark 242 2019-03-05 11:48:03.166
如何通过比较姓名和名册来获取最小日期。如果滚动不同,则应将其视为单独的记录
expected_output
name roll exm_date
tom 242 2019-03-05 11:48:03.166
mark 244 2018-03-05 11:48:03.166
tom 244 2020-03-05 11:48:03.166
为了比较一列(名称)与我正在使用的日期:
df=df.groupby('name')['exm_date'].min().reset_index()
尝试了这个:
df=df.groupby('name','roll')['exm_date'].min().reset_index()
答案 0 :(得分:2)
您在[]
子句中缺少方括号(groupby
):
执行此操作:
df = df.groupby(['name','roll'])['exm_date'].min().reset_index()