在this trick获取NumPy数组的唯一条目之后,我现在有一个双列数组,基本上是第一个元素的对,范围是[0.9:0.02:1.1],第二个元素在范围内[1.5:0.1:2.0]。我们称之为A
。目前,它完全未分类,即
In [111]: A
Out[111]:
array([[ 1.1 , 1.9 ],
[ 1.06, 1.9 ],
[ 1.08, 1.9 ],
[ 1.08, 1.6 ],
[ 0.9 , 1.8 ],
...
[ 1.04, 1.6 ],
[ 0.96, 2. ],
[ 0.94, 2. ],
[ 0.98, 1.9 ]])
我想对它进行排序,以便第一列中的每一行首先增加,然后是第一列。即。
array([[ 0.9 , 1.5 ],
[ 0.9 , 1.6 ],
[ 0.9 , 1.7 ],
[ 0.9 , 1.9 ],
[ 0.9 , 1.9 ],
[ 0.9 , 2. ],
[ 0.92, 1.5 ],
...
[ 1.08, 2. ],
[ 1.1 , 1.5 ],
[ 1.1 , 1.6 ],
[ 1.1 , 1.7 ],
[ 1.1 , 1.8 ],
[ 1.1 , 1.9 ],
[ 1.1 , 2. ]])
但我找不到可以同时给出两者的排序算法。根据建议here,我尝试了A[A[:,0].argsort()]
和A[A[:,1].argsort()]
,但他们每个只排序一列。我也试过应用两者,但同样的事情发生了。
如果我错过了一些简单的事情,我会道歉但是我一直在寻找这个... ...
答案 0 :(得分:6)
numpy.lexsort
可以在这里工作:
A[np.lexsort(A.T)]
在将A
传递给lexsort之前需要转置它,因为当传递一个二维数组时,它希望按行排序(最后一行,最后一行等)。
另一种可能更清晰的方法是明确传递列:
A[np.lexsort((A[:, 0], A[:, 1]))]
你仍然需要记住lexsort首先按最后一个键排序(这可能是一个很好的理由;它与在连续键上执行稳定排序相同)。
答案 1 :(得分:4)
以下内容可行,但可能有更快的方法:
A = np.array(sorted(A,key=tuple))
答案 2 :(得分:3)
只需替换A
为2D的整个事物(包括唯一部分):
A = np.ascontiguousarray(A) # just to make sure...
A = A.view([('', A.dtype)] * A.shape[1])
A = np.unique(A)
# And if you want the old view:
A = A.view(A.dtype[0]).reshape(-1,len(A.dtype))
我希望您没有使用链接问题中的set
解决方案,除非您不太关心速度。 lexsort
等通常很好,但这里没有必要,因为默认排序会做(如果它是一个重新排列)
编辑:一个不同的视图(结果大致相同),但可能因为不需要重新塑造而更加优雅:
A = A.view([('', A.dtype, A.shape[0])])
A = np.unique(A)
# And to go back
A = A.view(A.dtype[0].base)