GroupBy或汇总行以返回数据框?

时间:2019-10-28 21:08:43

标签: python pandas numpy dataframe

我有一个数据框,我想按最大日期对行进行分组。数据集如下所示:(date列已转换为日期时间格式)

species   date          breed        

cat       2019-01-01    Ragdoll
dog       2018-02-14    Pomeranian
dog       NaT           Huskey
cat       2017-05-25    Maine Coon
dog       2019-12-31    Shiba Inu
cat       NaT           Russian Blue

我想基于物种和物种的最大日期创建一个新的数据框,就像这样(我将不再需要breed列):

species    date

cat        2019-01-01
dog        2019-12-31

我当时正在考虑使用groupby语句,例如

df_pets_max_date =  df_pets.groupby(['species'])['date'].max()

但这并不能完全满足我的需求。似乎输出一个序列而不是一个数据框,并且列结构消失了。我不知道某种聚合函数是否会更好。获得此结果的最佳方法是什么?

0 个答案:

没有答案