在熊猫中创建具有0、1、0.5值而不是布尔值的列

时间:2018-10-08 15:53:42

标签: python python-3.x pandas

考虑此数据框:

id   Name   Score   
314  John    100    
345  Sara    200
355  Zack    200
333  Harry    50
334  Chad     50
331  Newton  100

我想基于score为新的运算符列分配自定义值,因此,如果一个得分小于下一个得分,则为1,如果大于0,则保持不变,则为0.5。这就是我想要的样子:

id   Name   Score  Operator
314  John    100      1
345  Sara    200     0.5
355  Zack    200      0
333  Harry    50     0.5
334  Chad     50      1    
331  Newton  100     NAN

我尝试了差分列和布尔列的组合,但是它没有任何摆脱二进制方法的途径

1 个答案:

答案 0 :(得分:4)

首先,设置您的条件:

prev = df.Score.shift(-1)
c1, c2, c3 = df.Score.lt(prev), df.Score.eq(prev), df.Score.gt(prev)

现在使用numpy.select

out = df.assign(out=np.select([c1, c2, c3], [1, 0.5, 0], np.nan))

    id    Name  Score  out
0  314    John    100  1.0
1  345    Sara    200  0.5
2  355    Zack    200  0.0
3  333   Harry     50  0.5
4  334    Chad     50  1.0
5  331  Newton    100  NaN

这是另一个有趣的解决方案(仅当您的差额从未小于0.5时有效):

df.Score.diff(-1).mul(-1).add(0.5).clip(0, 1)

0    1.0
1    0.5
2    0.0
3    0.5
4    1.0
5    NaN
Name: Score, dtype: float64