我有一个看起来像这样的数据框
pd.DataFrame({'A': ['C1', 'C2', 'C3', 'C4', 'C5'],
...: 'B': [6, 1, 7, 4, 3],
...: 'C': [True, True, False, False, True]})
Out[6]:
A B C
0 C1 6 True
1 C2 1 True
2 C3 7 False
3 C4 4 False
4 C5 3 True
对于其中C列为True的所有行,我要基于B列计算权重。结果数据帧应如下所示:
A B C weight
0 C1 6 True 0.6
1 C2 1 True 0.1
2 C3 7 False 0.0
3 C4 4 False 0.0
4 C5 3 True 0.3
适用的逻辑:
B列的总和,其中C = True = 10(6 + 1 + 3)
因此对于第0行(C1),“权重” = 6 / B的总和,其中C = True
如何用1行代码实现?
答案 0 :(得分:2)
你可以做
df['Weight'] = df['B']*df['C']/sum(df['B']*df['C'])
df
Out[136]:
A B C Weight
0 C1 6 True 0.6
1 C2 1 True 0.1
2 C3 7 False 0.0
3 C4 4 False 0.0
4 C5 3 True 0.3