如何根据条件计算熊猫行的权重

时间:2020-09-14 16:26:00

标签: python pandas

我有一个看起来像这样的数据框

pd.DataFrame({'A': ['C1', 'C2', 'C3', 'C4', 'C5'],
  ...:                    'B': [6, 1, 7, 4, 3],
  ...:                    'C': [True, True, False, False, True]})
Out[6]: 
    A  B      C
0  C1  6   True
1  C2  1   True
2  C3  7  False
3  C4  4  False
4  C5  3   True

对于其中C列为True的所有行,我要基于B列计算权重。结果数据帧应如下所示:

    A  B      C   weight
0  C1  6   True   0.6
1  C2  1   True   0.1
2  C3  7  False   0.0
3  C4  4  False   0.0
4  C5  3   True   0.3

适用的逻辑:

B列的总和,其中C = True = 10(6 + 1 + 3)

因此对于第0行(C1),“权重” = 6 / B的总和,其中C = True

如何用1行代码实现?

1 个答案:

答案 0 :(得分:2)

你可以做

df['Weight'] = df['B']*df['C']/sum(df['B']*df['C'])
df
Out[136]: 
    A  B      C  Weight
0  C1  6   True     0.6
1  C2  1   True     0.1
2  C3  7  False     0.0
3  C4  4  False     0.0
4  C5  3   True     0.3