考虑此数据框:
id Name Score
314 John 100
345 Sara 200
355 Zack 200
333 Harry 50
334 Chad 50
331 Newton 100
我想基于score为新的运算符列分配自定义值,因此,如果一个得分小于下一个得分,则为1,如果大于0,则保持不变,则为0.5。这就是我想要的样子:
id Name Score Operator
314 John 100 1
345 Sara 200 0.5
355 Zack 200 0
333 Harry 50 0.5
334 Chad 50 1
331 Newton 100 NAN
我尝试了差分列和布尔列的组合,但是它没有任何摆脱二进制方法的途径
答案 0 :(得分:4)
首先,设置您的条件:
prev = df.Score.shift(-1)
c1, c2, c3 = df.Score.lt(prev), df.Score.eq(prev), df.Score.gt(prev)
现在使用numpy.select
:
out = df.assign(out=np.select([c1, c2, c3], [1, 0.5, 0], np.nan))
id Name Score out
0 314 John 100 1.0
1 345 Sara 200 0.5
2 355 Zack 200 0.0
3 333 Harry 50 0.5
4 334 Chad 50 1.0
5 331 Newton 100 NaN
这是另一个有趣的解决方案(仅当您的差额从未小于0.5
时有效):
df.Score.diff(-1).mul(-1).add(0.5).clip(0, 1)
0 1.0
1 0.5
2 0.0
3 0.5
4 1.0
5 NaN
Name: Score, dtype: float64