查找NumPy数组与值列表中的任何值相等的位置

时间:2013-10-23 18:31:00

标签: python arrays numpy

我有一个整数数组,想要找到该数组在多个值列表中的任何值的位置。

这可以通过单独处理每个值,或者在循环中使用多个“或”语句来轻松完成,但我觉得必须有更好/更快的方法来完成它。我实际上正在处理大小为4000 x 2000的数组,但这里是问题的简化版本:

fake = arange(9).reshape((3,3))

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

want = (fake==0) + (fake==2) + (fake==6) + (fake==8)

print want 

array([[ True, False,  True],
       [False, False, False],
       [ True, False,  True]], dtype=bool)

我希望从包含want的单个命令和值fake的单个命令中获取[0, 2, 6, 8]

我假设有一个包含已包含的包,这比我在Python中编写带循环的函数要快得多。

3 个答案:

答案 0 :(得分:15)

函数numpy.in1d似乎可以做你想要的。唯一的问题是它只适用于1d数组,所以你应该像这样使用它:

In [9]: np.in1d(fake, [0,2,6,8]).reshape(fake.shape)
Out[9]: 
array([[ True, False,  True],
       [False, False, False],
       [ True, False,  True]], dtype=bool)

我不知道为什么这仅限于1d数组。看看它的source code,它首先似乎压平了两个数组,之后它做了一些巧妙的排序技巧。但是没有什么可以阻止它在结束时再破坏结果,就像我必须在这里手工做的那样。

答案 1 :(得分:5)

@Bas的回答是你可能正在寻找的答案。但是这是另一种方法,使用numpy的vectorize技巧:

import numpy as np
S = set([0,2,6,8])

@np.vectorize
def contained(x):
    return x in S

contained(fake)
=> array([[ True, False,  True],
          [False, False, False],
          [ True, False,  True]], dtype=bool)

这个解决方案的结果是为每个元素(即在python-space中)调用contained(),这使得它比纯粹的numpy解决方案慢得多。

答案 2 :(得分:3)

NumPy 0.13 +

从NumPy v0.13开始,您可以使用np.isin,它适用于多维数组:

>>> element = 2*np.arange(4).reshape((2, 2))
>>> element
array([[0, 2],
       [4, 6]])
>>> test_elements = [1, 2, 4, 8]
>>> mask = np.isin(element, test_elements)
>>> mask
array([[ False,  True],
       [ True,  False]])

NumPy 0.13之前的版本

接受np.in1d的答案仅适用于一维数组,并且需要重塑以获得所需结果。这对于v0.13之前的NumPy版本是好的。