按列对NumPy float数组进行排序

时间:2012-09-19 14:09:23

标签: python numpy

this trick获取NumPy数组的唯一条目之后,我现在有一个双列数组,基本上是第一个元素的对,范围是[0.9:0.02:1.1],第二个元素在范围内[1.5:0.1:2.0]。我们称之为A。目前,它完全未分类,即

In [111]: A
Out[111]: 
array([[ 1.1 ,  1.9 ],
       [ 1.06,  1.9 ],
       [ 1.08,  1.9 ],
       [ 1.08,  1.6 ],
       [ 0.9 ,  1.8 ],
       ...
       [ 1.04,  1.6 ],
       [ 0.96,  2.  ],
       [ 0.94,  2.  ],
       [ 0.98,  1.9 ]])

我想对它进行排序,以便第一列中的每一行首先增加,然后是第一列。即。

array([[ 0.9 ,  1.5 ],
       [ 0.9 ,  1.6 ],
       [ 0.9 ,  1.7 ],
       [ 0.9 ,  1.9 ],
       [ 0.9 ,  1.9 ],
       [ 0.9 ,  2.  ],
       [ 0.92,  1.5 ],
       ...
       [ 1.08,  2.  ],
       [ 1.1 ,  1.5 ],
       [ 1.1 ,  1.6 ],
       [ 1.1 ,  1.7 ],
       [ 1.1 ,  1.8 ],
       [ 1.1 ,  1.9 ],
       [ 1.1 ,  2.  ]])

但我找不到可以同时给出两者的排序算法。根据建议here,我尝试了A[A[:,0].argsort()]A[A[:,1].argsort()],但他们每个只排序一列。我也试过应用两者,但同样的事情发生了。

如果我错过了一些简单的事情,我会道歉但是我一直在寻找这个... ...

3 个答案:

答案 0 :(得分:6)

numpy.lexsort可以在这里工作:

A[np.lexsort(A.T)]

在将A传递给lexsort之前需要转置它,因为当传递一个二维数组时,它希望按行排序(最后一行,最后一行等)。

另一种可能更清晰的方法是明确传递列:

A[np.lexsort((A[:, 0], A[:, 1]))]

你仍然需要记住lexsort首先按最后一个键排序(这可能是一个很好的理由;它与在连续键上执行稳定排序相同)。

答案 1 :(得分:4)

以下内容可行,但可能有更快的方法:

A = np.array(sorted(A,key=tuple))

答案 2 :(得分:3)

只需替换A为2D的整个事物(包括唯一部分):

A = np.ascontiguousarray(A) # just to make sure...
A = A.view([('', A.dtype)] * A.shape[1])

A = np.unique(A)
# And if you want the old view:
A = A.view(A.dtype[0]).reshape(-1,len(A.dtype))

我希望您没有使用链接问题中的set解决方案,除非您不太关心速度。 lexsort等通常很好,但这里没有必要,因为默认排序会做(如果它是一个重新排列)


编辑:一个不同的视图(结果大致相同),但可能因为不需要重新塑造而更加优雅:

A = A.view([('', A.dtype, A.shape[0])])
A = np.unique(A)
# And to go back
A = A.view(A.dtype[0].base)