我有10000个客户的df,并且我试图查找每个客户每年的最后交易日期和金额。通过以下操作,我可以得出每个客户的最后日期,但无法在一年内找到它。
df [df.groupby('customer')。date.transform('max')
关于如何找到答案的任何想法
谢谢, 斯里尼瓦斯
答案 0 :(得分:0)
假设您在数据框中有一个名为 TransactionDate 的列,且交易日期为日期时间格式,则可以执行以下操作:
df['LastTransDateByYear'] = df.groupby(['Customer',df.TransactionDate.dt.year])['TransactionDate'].transform(max)
这会将列添加到数据框中,其日期为给定年份的最后交易日期。