根据一列中的值屏蔽2D numpy数组

时间:2011-01-07 13:08:21

标签: python arrays numpy mask

假设我有以下numpy数组:

a = [[1, 5, 6],
     [2, 4, 1],
     [3, 1, 5]]

我想屏蔽第一列中1的所有行。也就是说,我想要

   [[--, --, --],
     [2, 4, 1],
     [3, 1, 5]]

这可以使用numpy蒙面数组操作吗?一个人怎么做呢?

感谢。

3 个答案:

答案 0 :(得分:7)

import numpy as np

a = np.array([[1, 5, 6],
              [2, 4, 1],
              [3, 1, 5]])

np.ma.MaskedArray(a, mask=(np.ones_like(a)*(a[:,0]==1)).T)

# Returns: 
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]])

答案 1 :(得分:3)

您可以通过

创建所需的面具
mask = numpy.repeat(a[:,0]==1, a.shape[1])

和掩码数组

masked_a = numpy.ma.array(a, mask=numpy.repeat(a[:,0]==1, a.shape[1]))

答案 2 :(得分:1)

您可以简单地创建一个空面具,然后使用numpy-broadcasting(如@eumiro所示),但使用元素和按位"或" operator |

>>> a = np.array([[1, 5, 6], [2, 4, 1], [3, 1, 5]])

>>> mask = np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]

>>> np.ma.array(a, mask=mask)
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]],
       fill_value = 999999)

进一步解释:

>>> # select first column
>>> a[:, 0]  
array([1, 2, 3])

>>> # where the first column is 1
>>> a[:, 0] == 1  
array([ True, False, False], dtype=bool)

>>> # added dimension so that it correctly broadcasts to the empty mask
>>> (a[:, 0] == 1)[:, None]  
array([[ True],
       [False],
       [False]], dtype=bool)

>>> # create the final mask
>>> np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]  
array([[ True,  True,  True],
       [False, False, False],
       [False, False, False]], dtype=bool)

这种方法的另一个优点是它不需要使用可能昂贵的乘法或np.repeat因此它应该非常快。