获得numpy数组的argsort

时间:2015-04-30 00:09:26

标签: python numpy pandas

我有一个numpy数组如下:

array([ True,  True,  True,  True,  True, False,  True,  True, False,
        True, False,  True,  True,  True,  True,  True,  True, False,
       False, False, False, False,  True,  True, False, False, False,
        True,  True,  True,  True,  True,  True,  True, False,  True,
        True,  True,  True, False,  True,  True, False, False,  True,
        True,  True, False,  True,  True,  True, False], 

我想得到所有True元素的索引。像Pandas Series这样的numpy中没有get_loc方法,同样也没有像列表那样的索引方法。我不想将其转换为列表然后使用.index。

有什么想法吗?

3 个答案:

答案 0 :(得分:4)

使用ndarray.nonzero

>>> a.nonzero()
(array([ 0,  1,  2,  3,  4,  6,  7,  9, 11, 12, 13, 14, 15, 16, 22, 23, 27,
        28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49,
        50]),)

答案 1 :(得分:0)

在熊猫中这样做:

In [255]:

s[s==True].index
Out[255]:
Int64Index([0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 50], dtype='int64')

<强>更新

实际上,你可以使用这些值已经是布尔值的事实来掩盖系列:

In [256]:

s[s].index
Out[256]:
Int64Index([0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 50], dtype='int64')

对于numpy数组,您可以使用布尔值来屏蔽数组并使用np.where获取索引值:

In [261]:

np.where(a)
​
Out[261]:
(array([ 0,  1,  2,  3,  4,  6,  7,  9, 11, 12, 13, 14, 15, 16, 22, 23, 27,
        28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49,
        50], dtype=int64),)

答案 2 :(得分:0)

np.ix_方式似乎是最慢的。

In [846]: % timeit a.nonzero()
1000000 loops, best of 3: 707 ns per loop

In [845]: % timeit np.where(a)
1000000 loops, best of 3: 883 ns per loop

In [849]: %timeit np.ix_(a==True)
100000 loops, best of 3: 9.21 µs per loop