Numpy相当于if / else没有循环

时间:2017-08-19 06:04:25

标签: python numpy vectorization

是否有任何pythonic方法删除for循环和if / else在下面的代码中。

此代码迭代NumPy数组并检查条件并根据条件更改值。

>>> import numpy as np
>>> x=np.random.randint(100, size=(10,5))
>>> x
array([[79, 50, 18, 55, 35],
       [46, 71, 46, 95, 52],
       [97, 37, 71,  2, 79],
       [80, 96, 60, 85, 72],
       [ 6, 52, 63, 86, 38],
       [35, 50, 13, 93, 54],
       [69, 21,  4, 40, 53],
       [83,  7, 30, 16, 78],
       [18, 34, 91, 67, 89],
       [82, 16, 16, 24, 80]])

>>> for i in range(x.shape[0]):
    for j in range(x.shape[1]):
        if x[i,j]>50:
            x[i,j]=0
        elif x[i,j]<50:
            x[i,j]=1


>>> x
array([[ 0, 50,  1,  0,  1],
       [ 1,  0,  1,  0,  0],
       [ 0,  1,  0,  1,  0],
       [ 0,  0,  0,  0,  0],
       [ 1,  0,  0,  0,  1],
       [ 1, 50,  1,  0,  0],
       [ 0,  1,  1,  1,  0],
       [ 0,  1,  1,  1,  0],
       [ 1,  1,  0,  0,  0],
       [ 0,  1,  1,  1,  0]])

我想在没有循环和if语句的情况下做同样的事情。 由于阵列上的变化,下面的东西不起作用:

>>> import numpy as np
>>> x=np.random.randint(100, size=(10,5))
>>> x
array([[ 2, 88, 27, 67, 29],
       [62, 44, 62, 87, 32],
       [80, 95, 31, 30, 33],
       [14, 41, 40, 95, 27],
       [53, 30, 35, 22, 98],
       [90, 39, 74, 28, 73],
       [10, 71,  0, 11, 37],
       [28, 25, 83, 24, 93],
       [30, 70, 15,  5, 79],
       [69, 43, 85, 68, 53]])
>>> x[x>50]=0
>>> x[x<50]=1
>>> x
array([[1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1]])

更新 如果还有更多条件会发生什么:

   >>> import numpy as np
    >>> x=np.random.randint(100, size=(10,5))
    >>> x
    array([[87, 99, 70, 32, 28],
           [38, 76, 89, 17, 34],
           [28,  1, 40, 34, 67],
           [45, 47, 69, 78, 89],
           [14, 81, 46, 71, 97],
           [39, 45, 36, 36, 25],
           [87, 28,  1, 46, 99],
           [27, 98, 37, 36, 84],
           [55,  2, 23, 29,  9],
           [34, 79, 49, 76, 48]])
    >>> for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            if x[i,j]>90:
                x[i,j]=9
            elif x[i,j]>80:
                x[i,j]=8
            elif x[i,j]>70:
                x[i,j]=7
            elif x[i,j]>60:
                x[i,j]=6
            elif x[i,j]>50:
                x[i,j]=5
            elif x[i,j]>40:
                x[i,j]=4
            else:
                x[i,j]=0


    >>> x
    array([[8, 9, 6, 0, 0],
           [0, 7, 8, 0, 0],
           [0, 0, 0, 0, 6],
           [4, 4, 6, 7, 8],
           [0, 8, 4, 7, 9],
           [0, 4, 0, 0, 0],
           [8, 0, 0, 4, 9],
           [0, 9, 0, 0, 8],
           [5, 0, 0, 0, 0],
           [0, 7, 4, 7, 4]])

5 个答案:

答案 0 :(得分:14)

一个IF-ELIF

方法#1 一种方法 -

keep_mask = x==50
out = np.where(x>50,0,1)
out[keep_mask] = 50

方法#2 或者,对于原位编辑 -

replace_mask = x!=50
x[replace_mask] = np.where(x>50,0,1)[replace_mask]
# Or (x<=50).astype(int) in place of np.where(x>50,0,1)

Code-golf?如果你真的想玩代码 - 高尔夫/单线 -

(x<=50)+(x==50)*49

多个IF-ELIF

方法#1

对于涉及更多if-elif部分的更通用的案例,我们可以使用np.searchsorted -

out_x = np.where(x<=40,0, np.searchsorted([40,50,60,70,80,90], x)+3)

答案 1 :(得分:3)

完成循环所做的一切的单行程序:

x[x != 50] = x[x != 50] < 50

修改

对于您的扩展问题,您需要以下内容:

bins = [40, 50, 60, 70, 80, 90, 100]
out = np.digitize(x, bins, right = 1)
out[out.astype(bool)] += 3

答案 2 :(得分:2)

np.where(x < 50, 0, 1)

这应该足够了。你不需要保持50的掩码值,因为50不低于或不高于50.希望这会有所帮助。

答案 3 :(得分:0)

np.where(x < 50, 0, 1)

这应该足够了。您不需要保持50的掩码值,因为50不小于或大于50.希望这会有所帮助。

<强>更新

#update
np.where(x < 40, 0, x)
np.where(x > (x - (x % 10)), x // 10, x)

答案 4 :(得分:0)

很抱歉聚会晚了,只是想分享解决问题的另一种方法。

一线解决方案

x = np.where(x>=50, 50, 1) + np.where(x>50, -50, 0)

理论上

我们可以对以下两个numpy.where-matrix求和:

  • 对于矩阵A:如果x [i,j]> = 50,则设置值为50,否则设置为1,因为我们希望x [i,j] <50等于1。
  • 对于矩阵B:如果x [i,j]> 50,则将值设置为-50,因此对于x [i,j]> 50,两个矩阵的总和将为对应元素得出值0。

通过计算A + B,为条件x> 50(即-50)和x> = 50(即50)设置的值会得出所​​需的值(0和50),并且不会干扰为x < 50。

更新为更新

x = np.where(x>40, 4, 0) + np.where(x>50, 1, 0) + np.where(x>60, 1, 0) + np.where(x>70, 1, 0) + np.where(x>80, 1, 0) + np.where(x>90, 1, 0)

或更短一点,如果我们可以依靠值始终小于100的事实(如果需要整数则更改dtype):

x = np.where(x>40, np.floor(x/10), 0)

对我来说,这段代码可读性很强,但我可能没有代表性。