键等于Python Pandas中另一列的值的累积计数

时间:2018-12-16 17:46:29

标签: python pandas cumsum

我正在尝试在DataFrame中为每个团队汇总累积计数,其中 team = df ['result'] =='W'。 “ W”代表胜利,因此我试图计算每支球队在下一场比赛之前赢得多少场比赛。这是我的代码。

df = pd.DataFrame({
'team': ['Inter', 'Barca', 'Psv', 'Totten', 'Psv', 'Barca', 'Inter', 'Totten', 'Totten', 'Psv', 'Inter', 'Barca'],
'result': ['W', 'W', 'L', 'L', 'D', 'W', 'D', 'W', 'W', 'L', 'D', 'D']
})

df['each_played'] = df.groupby('team').cumcount()
df['each_won'] = ???
print(df)

我已经成功计算出每个团队在比赛前打了多少场比赛,但是无法让它在df ['each_won']中发挥作用。

所需的输出:

     team       result       each_played    each_won
0    Inter      W            0              0
1    Barca      W            0              0
2      Psv      L            0              0
3   Totten      L            0              0
4      Psv      D            1              0
5    Barca      W            1              1
6    Inter      D            1              1
7   Totten      W            1              0
8   Totten      W            2              1
9      Psv      L            2              0
10   Inter      D            2              1
11   Barca      D            2              2

我对熊猫还很陌生,任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

您的第二个问题是cumsum问题。在shift调用中,您需要cumsumGroupBy.apply

df['each_won'] = (df.result
                    .eq('W')
                    .groupby(df.team)
                    .apply(lambda x: x.shift().cumsum())
                    .fillna(0, downcast='infer'))
df
      team result  each_played each_won
0    Inter      W            0        0
1    Barca      W            0        0
2      Psv      L            0        0
3   Totten      L            0        0
4      Psv      D            1        0
5    Barca      W            1        1
6    Inter      D            1        1
7   Totten      W            1        0
8   Totten      W            2        1
9      Psv      L            2        0
10   Inter      D            2        1
11   Barca      D            2        2