我有一个数据框,我想按最大日期对行进行分组。数据集如下所示:(date
列已转换为日期时间格式)
species date breed
cat 2019-01-01 Ragdoll
dog 2018-02-14 Pomeranian
dog NaT Huskey
cat 2017-05-25 Maine Coon
dog 2019-12-31 Shiba Inu
cat NaT Russian Blue
我想基于物种和物种的最大日期创建一个新的数据框,就像这样(我将不再需要breed
列):
species date
cat 2019-01-01
dog 2019-12-31
我当时正在考虑使用groupby语句,例如
df_pets_max_date = df_pets.groupby(['species'])['date'].max()
但这并不能完全满足我的需求。似乎输出一个序列而不是一个数据框,并且列结构消失了。我不知道某种聚合函数是否会更好。获得此结果的最佳方法是什么?