替换大于某个值的Python NumPy Array的所有元素

时间:2013-10-29 18:42:54

标签: python arrays numpy replace conditional-statements

我有一个2D NumPy数组,并希望将其中的所有值替换为大于或等于阈值T的255.0。据我所知,最基本的方式是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255
  1. 最简洁和pythonic的方法是什么?

  2. 是否有更快(可能不那么简洁和/或更少pythonic)的方法呢?

  3. 这将是用于人体头部MRI扫描的窗口/水平调整子程序的一部分。 2D numpy数组是图像像素数据。

7 个答案:

答案 0 :(得分:256)

我认为最简单,最简洁的方法是使用NumPy的内置Fancy索引。如果您的ndarray名为arr,则可以使用值>255替换所有元素x,如下所示:

arr[arr > 255] = x

我在我的机器上运行了500 x 500随机矩阵,将所有值> 0.5替换为5,平均花费了7.59ms。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop

答案 1 :(得分:40)

由于您实际上想要一个arr其中arr < 255255的其他数组,否则可以这样做:

result = np.minimum(arr, 255)

更一般地说,对于较低和/或上限:

result = np.clip(arr, 0, 255)

如果您只想访问超过255的值或更复杂的值,@ mtitan8的答案更为一般,但np.clipnp.minimum(或np.maximum)更好,更多更快的情况:

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop

In [293]: %%timeit
   .....: c = np.copy(a)
   .....: c[a>255] = 255
   .....: 
10000 loops, best of 3: 86.6 µs per loop

如果您想就地执行此操作(即修改arr而不是创建result),您可以使用out的{​​{1}}参数:

np.minimum

np.minimum(arr, 255, out=arr)

np.clip(arr, 0, 255, arr) 名称是可选的,因为参数的顺序与函数的定义相同。)

对于就地修改,布尔索引加速很多(无需单独制作然后修改副本),但仍然没有out=那么快:

minimum

为了进行比较,如果您想要将值限制为最小值和最大值,而不使用In [328]: %%timeit .....: a = np.random.randint(0, 300, (100,100)) .....: np.minimum(a, 255, a) .....: 100000 loops, best of 3: 303 µs per loop In [329]: %%timeit .....: a = np.random.randint(0, 300, (100,100)) .....: a[a>255] = 255 .....: 100000 loops, best of 3: 356 µs per loop ,则必须执行此操作两次,例如

clip

或,

np.minimum(a, 255, a)
np.maximum(a, 0, a)

答案 2 :(得分:9)

我认为使用where函数可以实现最快:

例如,在numpy数组中查找大于0.2的项目并将其替换为0:

import numpy as np

nums = np.random.rand(4,3)

print np.where(nums > 0.2, 0, nums)

答案 3 :(得分:8)

您可以考虑使用 numpy.putmask

np.putmask(arr, arr>=T, 255.0)

这是与Numpy内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop

答案 4 :(得分:6)

另一种方法是使用np.place进行就地替换并使用多维数组:

import numpy as np

arr = np.arange(6).reshape(2, 3)
np.place(arr, arr == 0, -10)

答案 5 :(得分:1)

您还可以使用&|(和/或)来获得更大的灵活性:

5到10之间的值:A[(A>5)&(A<10)]

大于10或小于5的值:A[(A<5)|(A>10)]

答案 6 :(得分:1)

让我们假设您有一个numpy数组,该数组包含从0一直到20的值,并且您想用0替换大于10的数字

import numpy as np

my_arr = np.arange(0,21) # creates an array
my_arr[my_arr > 10] = 0 # modifies the value

但是请注意,这将修改原始数组,以避免覆盖原始数组,请尝试使用arr.copy()创建原始数组的新分离副本并进行修改。

import numpy as np

my_arr = np.arange(0,21)
my_arr_copy = my_arr.copy() # creates copy of the orignal array

my_arr_copy[my_arr_copy > 10] = 0