2d和1d Numpy阵列的交点

时间:2015-09-09 13:54:20

标签: python arrays numpy intersection

对于数组A[:,3:]中同样位于数组B中的每个元素,我想将值设置为0,这将创建数组result

import numpy as np

A = np.array([[1, 1, 10, 101, 102, 103,   0,   0],
              [2, 2, 10, 102, 108,   0,   0,   0],
              [3, 3, 11, 101, 102, 106, 107, 108]])

B = np.array([101, 106, 108])

result = np.array([[1, 1, 10,   0, 102, 103,   0,   0],
                   [2, 2, 10, 102,   0,   0,   0,   0],
                   [3, 3, 11,   0, 102,   0, 107,   0]])

我知道有一种方法可以使用in1d并将A作为一维数组广播,但我不知道如何解决这个问题。

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:6)

如果您将切片的二维数组A[:,3:]输入到 np.in1d,它会将其展平为一维数组并与B进行比较,从而创建一维掩码,被重新整形并用于对该切片数组进行布尔索引,以将TRUE元素设置为zeros。单行实现看起来像这样 -

A[:,3:][np.in1d(A[:,3:],B).reshape(A.shape[0],-1)] = 0

示例运行 -

In [37]: A
Out[37]: 
array([[  1,   1,  10, 101, 102, 103,   0,   0],
       [  2,   2,  10, 102, 108,   0,   0,   0],
       [  3,   3,  11, 101, 102, 106, 107, 108]])

In [38]: np.in1d(A[:,3:],B) # Flattened mask
Out[38]: 
array([ True, False, False, False, False, False,  True, False, False,
       False,  True, False,  True, False,  True], dtype=bool)

In [39]: np.in1d(A[:,3:],B).reshape(A.shape[0],-1) # Reshaped mask
Out[39]: 
array([[ True, False, False, False, False],
       [False,  True, False, False, False],
       [ True, False,  True, False,  True]], dtype=bool)

In [40]: A[:,3:][np.in1d(A[:,3:],B).reshape(A.shape[0],-1)] = 0 # Final code

In [41]: A
Out[41]: 
array([[  1,   1,  10,   0, 102, 103,   0,   0],
       [  2,   2,  10, 102,   0,   0,   0,   0],
       [  3,   3,  11,   0, 102,   0, 107,   0]])

为了简化操作,您可以创建展平A的视图,并使用从np.in1d获得的1D蒙版来获得更优雅的解决方案。对于仅更改切片A[:,3:]的解决方案,您可以使用.flat,然后像这样索引 -

A[:,3:].flat[np.in1d(A[:,3:],B)] = 0

如果您希望在整个A中设置匹配的匹配,可以使用.ravel() -

A.ravel()[np.in1d(A,B)] = 0

我知道.ravel()是一种观点,而且从文档来看,似乎.flat也没有创建副本,所以这些应该便宜

答案 1 :(得分:-2)

这是一种在不使用in1d()的情况下执行此操作的方法。您可以将常规Python in运算符与数组的ravel版本一起使用:

listed = [aa  in B for aa in A[:, 3:].ravel()]

# mask for unaffected left columns of A
mask1 = np.array([False]*A.shape[0]*3)
mask1.shape = (A.shape[0], 3)

# mask for affected right columns of A
mask2 = np.array(listed)
mask2.shape = (A.shape[0], A.shape[1]-3)

# join masks together so you have a mask with same dimensions as A
mask = np.hstack((mask1, mask2))

result  = A.copy()
result[mask] = 0

或者更简洁:

listed = [aa  in B for aa in A[:, 3:].ravel()]
listed_array = np.array(listed)
listed.shape = (A.shape[0], A.shape[1]-3)
A[:, 3:][listed_array] = 0

你可能会更好地使用in1d(),但很高兴知道还有其他选择。