我正在寻找一种有效的方法来获取两个二维numpy ndarray的按行相交。每行只有一个交叉点。例如:
[[1, 2], ∩ [[0, 1], -> [1,
[3, 4]] [0, 3]] 3]
在最佳情况下,应忽略零:
[[1, 2, 0], ∩ [[0, 1, 0], -> [1,
[3, 4, 0]] [0, 3, 0]] 3]
我的解决方案:
import numpy as np
arr1 = np.array([[1, 2],
[3, 4]])
arr2 = np.array([[0, 1],
[0, 3]])
arr3 = np.empty(len(arr1))
for i in range(len(arr1)):
arr3[i] = np.intersect1d(arr1[i], arr2[i])
print(arr3)
# [ 1. 3.]
我大约有100万行,因此向量化操作是最优选的。欢迎您使用其他python软件包。
答案 0 :(得分:1)
您可以使用np.apply_along_axis。 我写了一个解决方案,可以适应arr1的大小。 没有测试效率。
import numpy as np
def intersect1d_padded(x):
x, y = np.split(x, 2)
padded_intersection = -1 * np.ones(x.shape, dtype=np.int)
intersection = np.intersect1d(x, y)
padded_intersection[:intersection.shape[0]] = intersection
return padded_intersection
def rowwise_intersection(a, b):
return np.apply_along_axis(intersect1d_padded,
1, np.concatenate((a, b), axis=1))
result = rowwise_intersection(arr1,arr2)
>>> array([[ 1, -1],
[ 3, -1]])
如果您知道交点中只有一个元素可以使用
result = rowwise_intersection(arr1,arr2)[:,0]
>>> array([1, 3])
您还可以修改intersect1d_padded,以返回具有交集值的标量。
答案 1 :(得分:0)
我不知道在numpy
中有一种优雅的方法,但是简单的列表理解可以达到目的:
[list(set.intersection(set(_x),set(_y)).difference({0})) for _x,_y in zip(x,y)]