Numpy元素在运作中

时间:2016-10-21 11:19:18

标签: python performance numpy vectorization elementwise-operations

假设我有一个长度为n的列向量y,并且我有一个大小为n * m的矩阵X.我想检查y中的每个元素,该元素是否在X中的相应行中。这样做的最有效方法是什么?

例如:

y = [1,2,3,4].T

X =[[1, 2, 3],[3, 4, 5],[4, 3, 2],[2, 2, 2]]

然后输出应为

[1, 0, 1, 0] or [True, False, True, False] 

这更容易。

当然我们可以使用for循环遍历y和X,但有没有更有效的方法呢?

1 个答案:

答案 0 :(得分:2)

使用broadcasting -

的矢量化方法
((X == y[:,None]).any(1)).astype(int)

示例运行 -

In [41]: X        # Input 1
Out[41]: 
array([[1, 2, 3],
       [3, 4, 5],
       [4, 3, 2],
       [2, 2, 2]])

In [42]: y        # Input 2
Out[42]: array([1, 2, 3, 4])

In [43]: X == y[:,None] # Broadcasted  comparison
Out[43]: 
array([[ True, False, False],
       [False, False, False],
       [False,  True, False],
       [False, False, False]], dtype=bool)

In [44]: (X == y[:,None]).any(1) # Check for any match along each row
Out[44]: array([ True, False,  True, False], dtype=bool)

In [45]: ((X == y[:,None]).any(1)).astype(int) # Convert to 1s and 0s
Out[45]: array([1, 0, 1, 0])