我有一个numpy主数组。给定另一个具有重复元素的搜索值数组,我想在主数组中生成这些搜索值的索引。
例如:主数组是[1,2,3,4,5],搜索数组是[4,2,2,3]
解决方案:[3,1,1,2]
是否有一个“原生”numpy函数可以有效地执行此操作(意味着以C速度而不是python速度)?
我知道以下解决方案,但是,首先,它是一个python列表理解,其次,它将搜索2的索引两次。
ma = np.array([1,2,3,4,5])
sl = np.array([4,2,2,3])
ans = [np.where(ma==i) for i in sl]
此外,如果我不得不求助于排序和二元搜索,我将作为最后的手段(不是各种级别的双关语)。我有兴趣发现我是否遗漏了numpy库中的基本内容。这些列表非常大,因此性能至关重要。
感谢。
编辑: 在发布之前,我尝试了以下结果,结果令人沮丧:
[np.searchsorted(ma,x) for x in sl]
@pierre发布的解决方案更具高效性,正是我所寻求的。
答案 0 :(得分:15)
np.searchsorted
会为你效力吗?
>>> master = np.array([1,2,3,4,5])
>>> search = np.array([4,2,2,3])
>>> np.searchsorted(master, search)
array([3, 1, 1, 2])