我有一个当前看起来像这样的数据框。
season date winner
59 2008 2008-04-18 KKR
60 2008 2008-04-19 CSK
61 2008 2008-04-19 DC
62 2008 2008-04-20 RCB
63 2008 2008-04-20 KKR
64 2008 2008-04-21 RR
有一个带有日期的日期列和一个带有该日期获胜球队名称的获胜者列。
我正在尝试进行条形图竞赛。为此,我需要分别获取每个日期的数据,其中每个日期包含所有团队以及该日期之前这些团队的获胜次数。
我以一种排序的方式安排了日期,并添加了一个列,在该列中,我按“优胜者”列对数据进行了分组,并使用cumcount函数获取了累计计数。
df["col"]=df.groupby(["winner"]).cumcount()+1
现在,看起来像这样。
season date winner col
59 2008 2008-04-18 KKR 1
60 2008 2008-04-19 CSK 1
61 2008 2008-04-19 DC 1
62 2008 2008-04-20 RCB 1
63 2008 2008-04-20 KKR 2
64 2008 2008-04-21 RR 1
对于任何日期,我都有当天获胜者的数据,但我不知道如何获取该日期其他团队的数据。
我也查看了this answer,但是这里不需要使用特定日期在名称列中不存在的值。
基本上,我需要一个函数来传递日期,直到该日期为止,每个团队都没有获胜的机会。
任何帮助将不胜感激。