使用Numpy以矢量化方式检索多个值的索引

时间:2018-03-02 10:20:16

标签: python numpy indexing

为了在numpy数组中得到对应于“99”值的索引,我们这样做:

mynumpy=([5,6,9,2,99,3,88,4,7))
np.where(my_numpy==99)

如果,我想获得对应于以下值99,55,6,3,7的索引怎么办?显然,可以通过一个简单的循环来实现它,但我正在寻找更多的矢量化解决方案。我知道Numpy非常强大所以我认为它可能存在类似的东西。

期望的输出:

searched_values=np.array([99,55,6,3,7])
np.where(searched_values in mynumpy)
[(4),(),(1),(5),(8)]

1 个答案:

答案 0 :(得分:2)

这是np.searchsorted -

的一种方法
def find_indexes(ar, searched_values, invalid_val=-1):
    sidx = ar.argsort()
    pidx = np.searchsorted(ar, searched_values, sorter=sidx)
    pidx[pidx==len(ar)] = 0
    idx = sidx[pidx]
    idx[ar[idx] != searched_values] = invalid_val
    return idx

示例运行 -

In [29]: find_indexes(mynumpy, searched_values, invalid_val=-1)
Out[29]: array([ 4, -1,  1,  5,  8])

对于通用的无效值说明符,我们可以使用np.where -

def find_indexes_v2(ar, searched_values, invalid_val=-1):
    sidx = ar.argsort()
    pidx = np.searchsorted(ar, searched_values, sorter=sidx)
    pidx[pidx==len(ar)] = 0
    idx = sidx[pidx]
    return np.where(ar[idx] == searched_values, idx, invalid_val)

示例运行 -

In [35]: find_indexes_v2(mynumpy, searched_values, invalid_val=None)
Out[35]: array([4, None, 1, 5, 8], dtype=object)

# For list output
In [36]: find_indexes_v2(mynumpy, searched_values, invalid_val=None).tolist()
Out[36]: [4, None, 1, 5, 8]