我想做这样的事情:
>>> y = np.arange(5)
>>> y in (0, 1, 2)
array([True, True, True, False, False])
此语法无效。达到预期效果的最佳方法是什么?
(我正在寻找一个通用的解决方案。显然,在这种情况下,我可以做y < 3
。)
我会为你们更清楚地说明这一点,因为至少有些人似乎很困惑。
这里有很长的路要走我想要的行为:
new_y = np.empty_like(y)
for i in range(len(y)):
if y[i] in (0, 1, 2):
new_y[i] = True
else:
new_y[i] = False
我正在寻找一种更紧凑的形式的行为。
这是另一种解决方案:
new_y = np.array([True if item in (0, 1, 2) else False for item in y])
再次,只是寻找一种更简单的方法。
答案 0 :(得分:2)
一个好的通用工具是两个数组元素之间的广播比较或“外部”比较:
In [35]: y=np.arange(5)
In [36]: x=np.array([0,1,2])
In [37]: y[:,None]==x
Out[37]:
array([[ True, False, False],
[False, True, False],
[False, False, True],
[False, False, False],
[False, False, False]])
这是在y
的每个元素和x
的每个元素之间进行快速比较。根据您的需要,可以沿轴之一压缩该数组:
In [38]: (y[:,None]==x).any(axis=1)
Out[38]: array([ True, True, True, False, False])
评论建议in1d
。我认为查看其代码是个好主意。根据输入的相对大小,它有几种策略。
In [40]: np.in1d(y,x)
Out[40]: array([ True, True, True, False, False])
In [41]: np.array([True if item in x else False for item in y])
Out[41]: array([ True, True, True, False, False])
最快的可能取决于输入的大小。从开始列表开始,您的列表理解可能会更快。迄今为止,此纯列表版本是最快的:
[True if item in (0,1,2) else False for item in (0,1,2,3,4)]
[item in (0,1,2) for item in (0,1,2,3,4)] # simpler