如何正确掩盖numpy 2D阵列?

时间:2016-07-05 01:18:46

标签: python numpy matrix mask masked-array

假设我有一个二维坐标数组,看起来像

x = array([[1,2],[2,3],[3,4]])

以前在我的工作中,我生成了一个最终看起来像

的面具

mask = [False,False,True]

当我尝试在2D坐标向量上使用此蒙版时,出现错误

newX = np.ma.compressed(np.ma.masked_array(x,mask))

>>>numpy.ma.core.MaskError: Mask and data not compatible: data size 
   is 6, mask size is 3.`
我想,这是有道理的。所以我试着简单地使用以下掩码:

mask2 = np.column_stack((mask,mask))
newX = np.ma.compressed(np.ma.masked_array(x,mask2))

我得到的是关闭:

>>>array([1,2,2,3])

到我期望(并且想要):

>>>array([[1,2],[2,3]])

必须有一种更简单的方法吗?

4 个答案:

答案 0 :(得分:7)

这是你在找什么?

import numpy as np
x[~np.array(mask)]
# array([[1, 2],
#        [2, 3]])

或来自numpy masked array

newX = np.ma.array(x, mask = np.column_stack((mask, mask)))
newX

# masked_array(data =
#  [[1 2]
#  [2 3]
#  [-- --]],
#              mask =
#  [[False False]
#  [False False]
#  [ True  True]],
#        fill_value = 999999)

答案 1 :(得分:5)

您的x是3x2:

In [379]: x
Out[379]: 
array([[1, 2],
       [2, 3],
       [3, 4]])

制作一个3元素的布尔掩码:

In [380]: rowmask=np.array([False,False,True])

可用于选择True为True的行,或者为False的行。在这两种情况下,结果都是2d:

In [381]: x[rowmask,:]
Out[381]: array([[3, 4]])

In [382]: x[~rowmask,:]
Out[382]: 
array([[1, 2],
       [2, 3]])

这不使用MaskedArray子类。要制作这样的数组,我们需要一个在形状上匹配x的掩码。没有规定只掩盖一个维度。

In [393]: xmask=np.stack((rowmask,rowmask),-1)  # column stack

In [394]: xmask
Out[394]: 
array([[False, False],
       [False, False],
       [ True,  True]], dtype=bool)

In [395]: np.ma.MaskedArray(x,xmask)
Out[395]: 
masked_array(data =
 [[1 2]
 [2 3]
 [-- --]],
             mask =
 [[False False]
 [False False]
 [ True  True]],
       fill_value = 999999)

compressed应用于此会产生一个raveled数组:array([1, 2, 2, 3])

由于屏蔽是逐个元素的,它可以屏蔽第1行中的一个元素,第2行中的第2个等等。因此,通常compressing删除屏蔽元素不会产生2d数组。扁平形式是唯一的一般选择。

当有掩盖值散布时,

np.ma最有意义。如果您想要选择或取消选择整行或列,则它没有多大价值。

===============

以下是更典型的蒙版数组:

In [403]: np.ma.masked_inside(x,2,3)
Out[403]: 
masked_array(data =
 [[1 --]
 [-- --]
 [-- 4]],
             mask =
 [[False  True]
 [ True  True]
 [ True False]],
       fill_value = 999999)

In [404]: np.ma.masked_equal(x,2)
Out[404]: 
masked_array(data =
 [[1 --]
 [-- 3]
 [3 4]],
             mask =
 [[False  True]
 [ True False]
 [False False]],
       fill_value = 2)

In [406]: np.ma.masked_outside(x,2,3)
Out[406]: 
masked_array(data =
 [[-- 2]
 [2 3]
 [3 --]],
             mask =
 [[ True False]
 [False False]
 [False  True]],
       fill_value = 999999)

答案 2 :(得分:2)

由于这些解决方案都不适用于我,我想写下解决方案的作用,也许对其他人有用。我使用python 3.x,我在两个3D阵列上工作。一个,我称之为data_3D包含脑部扫描中记录的浮点值,另一个template_3D包含代表大脑区域的整数。我想根据data_3D选择region_code对应于整数template_3D的值:

my_mask = np.in1d(template_3D, region_code).reshape(template_3D.shape)
data_3D_masked = data_3D[my_mask]

这给了我一个只有相关录音的一维数组。

答案 3 :(得分:1)

在上一个例子中,问题不是面具。这是您对compressed的使用。来自compressed的文档字符串:

Return all the non-masked data as a 1-D array.

因此compressed将非屏蔽值展平为1-d数组。 (必须这样做,因为无法保证压缩数据具有n维结构。)

在压缩之前先看一下蒙面数组:

In [8]: np.ma.masked_array(x, mask2)

Out[8]: 
masked_array(data =
 [[1 2]
 [2 3]
 [-- --]],
             mask =
 [[False False]
 [False False]
 [ True  True]],
       fill_value = 999999)