我有两个numpy数组:
A.shape = (nA,x,y)
和
B.shape = (nB,x,y).
我想找到所有的子阵列
A(i,:,:) == B(j,:,:).
我知道我可以写一个double for循环并使用
np.array_equal(A(i,:,:),B(j,:,:)
但是,有更有效的方法吗?
答案 0 :(得分:1)
您应该只需要循环遍历其中一个数组,因为之后您将找不到任何其他唯一子数组,并且您可以使用简单的列表解析来执行此操作。
subarrays = [x for x in A if x in B]
如果您只想要索引而不是存储整个子数组,则可以执行以下操作:
indices = [x[0] for x in enumerate(A) if x[1] in B]
答案 1 :(得分:1)
利用Steven Rouk的解决方案,这里有一个方法来获得相同的子数组的索引:
indicesForMatches = [(i,j) for i,subArrayOfA in enumerate(A) for j,subArrayOfB in enumerate(B) if np.array_equal(subArrayOfA,subArrayOfB)]
答案 2 :(得分:1)
您可以使用NumPy broadcasting
作为矢量化解决方案,如此 -
mask = ((A[:,None,:,:] == B).all(2)).all(2)
A_idx,B_idx = np.where(mask)
你可以使用reshaping
来避免使用双.all()
次使用并获取掩码,就像这样 -
mask = (A.reshape(A.shape[0],1,-1) == B.reshape(B.shape[0],-1)).all(-1)
示例运行 -
In [41]: # Setup input arrays and force some indices to be same between A and B
...: nA = 4
...: nB = 5
...: x = 3
...: y = 2
...:
...: A = np.random.randint(0,9,(nA,x,y))
...: B = np.random.randint(0,9,(nB,x,y))
...:
...: A[2,:,:] = B[1,:,:]
...: A[3,:,:] = B[4,:,:]
...:
In [42]: mask = ((A[:,None,:,:] == B).all(2)).all(2)
...: A_idx,B_idx = np.where(mask)
...:
In [43]: A_idx, B_idx
Out[43]: (array([2, 3]), array([1, 4]))
In [44]: mask = (A.reshape(A.shape[0],1,-1) == B.reshape(B.shape[0],-1)).all(-1)
...: A_idx,B_idx = np.where(mask)
...:
In [45]: A_idx, B_idx
Out[45]: (array([2, 3]), array([1, 4]))