在numpy中,如果所有行在二维数组中都不同,是否有一种很好的惯用方法?
我以为我能做到
len(np.unique(arr)) == len(arr)
但这根本不起作用。例如,
arr = np.array([[1,2,3],[1,2,4]])
np.unique(arr)
Out[4]: array([1, 2, 3, 4])
答案 0 :(得分:0)
您可以计算相关矩阵并询问仅对角元素是否为1
:
(np.corrcoef(M)==1).sum()==M.shape[0]
In [66]:
M = np.random.random((5,8))
In [72]:
(np.corrcoef(M)==1).sum()==M.shape[0]
Out[72]:
True
如果你想为列做类似的事情:
(np.corrcoef(M, rowvar=0)==1).sum()==M.shape[1]
或根本没有numpy
:
len(set(map(tuple,M)))==len(M)
指出唯一的行,然后测试结果是否与M
相同是一种过度杀伤:
In [99]:
%%timeit
b = np.ascontiguousarray(M).view(np.dtype((np.void, M.dtype.itemsize * M.shape[1])))
_, idx = np.unique(b, return_index=True)
unique_M = M[idx]
unique_M.shape==M.shape
10000 loops, best of 3: 54.6 µs per loop
In [100]:
%timeit len(set(map(tuple,M)))==len(M)
10000 loops, best of 3: 24.9 µs per loop