我正在尝试在DataFrame中为每个团队汇总累积计数,其中 team = df ['result'] =='W'。 “ W”代表胜利,因此我试图计算每支球队在下一场比赛之前赢得多少场比赛。这是我的代码。
df = pd.DataFrame({
'team': ['Inter', 'Barca', 'Psv', 'Totten', 'Psv', 'Barca', 'Inter', 'Totten', 'Totten', 'Psv', 'Inter', 'Barca'],
'result': ['W', 'W', 'L', 'L', 'D', 'W', 'D', 'W', 'W', 'L', 'D', 'D']
})
df['each_played'] = df.groupby('team').cumcount()
df['each_won'] = ???
print(df)
我已经成功计算出每个团队在比赛前打了多少场比赛,但是无法让它在df ['each_won']中发挥作用。
所需的输出:
team result each_played each_won
0 Inter W 0 0
1 Barca W 0 0
2 Psv L 0 0
3 Totten L 0 0
4 Psv D 1 0
5 Barca W 1 1
6 Inter D 1 1
7 Totten W 1 0
8 Totten W 2 1
9 Psv L 2 0
10 Inter D 2 1
11 Barca D 2 2
我对熊猫还很陌生,任何帮助将不胜感激。
答案 0 :(得分:1)
您的第二个问题是cumsum
问题。在shift
调用中,您需要cumsum
和GroupBy.apply
。
df['each_won'] = (df.result
.eq('W')
.groupby(df.team)
.apply(lambda x: x.shift().cumsum())
.fillna(0, downcast='infer'))
df
team result each_played each_won
0 Inter W 0 0
1 Barca W 0 0
2 Psv L 0 0
3 Totten L 0 0
4 Psv D 1 0
5 Barca W 1 1
6 Inter D 1 1
7 Totten W 1 0
8 Totten W 2 1
9 Psv L 2 0
10 Inter D 2 1
11 Barca D 2 2