如何测试所有行是否在numpy中是不同的

时间:2014-10-02 16:56:46

标签: python numpy

在numpy中,如果所有行在二维数组中都不同,是否有一种很好的惯用方法?

我以为我能做到

len(np.unique(arr)) == len(arr)

但这根本不起作用。例如,

arr = np.array([[1,2,3],[1,2,4]])
np.unique(arr)
Out[4]: array([1, 2, 3, 4])

1 个答案:

答案 0 :(得分:0)

您可以计算相关矩阵并询问对角元素是否为1

(np.corrcoef(M)==1).sum()==M.shape[0]


In [66]:

M = np.random.random((5,8))
In [72]:

(np.corrcoef(M)==1).sum()==M.shape[0]
Out[72]:
True

如果你想为列做类似的事情:

(np.corrcoef(M, rowvar=0)==1).sum()==M.shape[1]

或根本没有numpy

len(set(map(tuple,M)))==len(M)

指出唯一的行,然后测试结果是否与M相同是一种过度杀伤:

In [99]:

%%timeit

b = np.ascontiguousarray(M).view(np.dtype((np.void, M.dtype.itemsize * M.shape[1])))
_, idx = np.unique(b, return_index=True)

unique_M = M[idx]

unique_M.shape==M.shape
10000 loops, best of 3: 54.6 µs per loop
In [100]:

%timeit len(set(map(tuple,M)))==len(M)
10000 loops, best of 3: 24.9 µs per loop