我试图返回与相当大的数据框中的最新日期相对应的“ ID”和“ ctn”值。下面是数据帧(df)的一个小示例。
ID cnt date
1 US 2018-02-01
2 CA 2017-10-01
3 UK 2018-06-10
2 UK 2018-08-23
1 FR 2017-05-01
因此,输出应如下所示。
ID cnt date
2 UK 2018-08-23
3 UK 2018-06-10
1 US 2018-02-01
在“ ID”上应用“ group_by”方法,然后在日期的“ max()”上应用
df.groupby('ID')['date'].max()
为我提供每个“ ID”的最新日期;但是,我不确定如何在“ df”中检索相应的“ ctn”值。谢谢!
答案 0 :(得分:2)
在分组之前,按日期对数据框进行排序。最新的条目将始终是最后一条:
df.sort_values('date').groupby('ID').last()