检查numpy数组中的每个元素是否在单独的列表中

时间:2019-03-09 19:49:21

标签: python arrays numpy vectorization

我想做这样的事情:

>>> y = np.arange(5)
>>> y in (0, 1, 2)
array([True, True, True, False, False])

此语法无效。达到预期效果的最佳方法是什么?

(我正在寻找一个通用的解决方案。显然,在这种情况下,我可以做y < 3。)

我会为你们更清楚地说明这一点,因为至少有些人似乎很困惑。

这里有很长的路要走我想要的行为:

new_y = np.empty_like(y)
for i in range(len(y)):
    if y[i] in (0, 1, 2):
        new_y[i] = True
    else:
        new_y[i] = False

我正在寻找一种更紧凑的形式的行为。

这是另一种解决方案:

new_y = np.array([True if item in (0, 1, 2) else False for item in y])

再次,只是寻找一种更简单的方法。

1 个答案:

答案 0 :(得分:2)

一个好的通用工具是两个数组元素之间的广播比较或“外部”比较:

In [35]: y=np.arange(5)                                                         
In [36]: x=np.array([0,1,2])                                                    
In [37]: y[:,None]==x                                                           
Out[37]: 
array([[ True, False, False],
       [False,  True, False],
       [False, False,  True],
       [False, False, False],
       [False, False, False]])

这是在y的每个元素和x的每个元素之间进行快速比较。根据您的需要,可以沿轴之一压缩该数组:

In [38]: (y[:,None]==x).any(axis=1)                                             
Out[38]: array([ True,  True,  True, False, False])

评论建议in1d。我认为查看其代码是个好主意。根据输入的相对大小,它有几种策略。

In [40]: np.in1d(y,x)                                                           
Out[40]: array([ True,  True,  True, False, False])
In [41]: np.array([True if item in x else False for item in y])                 
Out[41]: array([ True,  True,  True, False, False])

最快的可能取决于输入的大小。从开始列表开始,您的列表理解可能会更快。迄今为止,此纯列表版本是最快的:

[True if item in (0,1,2) else False for item in (0,1,2,3,4)] 
[item in (0,1,2) for item in (0,1,2,3,4)]    # simpler