为2D NumPy数组的每一行有效地应用不同的排列

时间:2019-06-10 22:34:49

标签: python arrays numpy random

给定矩阵A,我想对A的不同行应用不同的随机洗牌;例如

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

成为

array([[1, 3, 2],
       [6, 5, 4],
       [7, 9, 8]])

当然,我们可以循环遍历矩阵,并使每一行随机洗牌;但是迭代很慢,我在问是否有更有效的方法可以做到这一点。

2 个答案:

答案 0 :(得分:2)

从Divakar那里挑选了一个巧妙的技巧,涉及randnargsort

np.random.seed(0)

s = np.arange(16).reshape(4, 4)
np.take_along_axis(s, np.random.randn(*s.shape).argsort(axis=1), axis=1)

array([[ 1,  0,  3,  2],
       [ 4,  6,  5,  7],
       [11, 10,  8,  9],
       [14, 12, 13, 15]])

对于2D阵列,可以简化为

s[np.arange(len(s))[:,None], np.random.randn(*s.shape).argsort(axis=1)]

array([[ 1,  0,  3,  2],
       [ 4,  6,  5,  7],
       [11, 10,  8,  9],
       [14, 12, 13, 15]])

您还可以在每行上单独应用np.random.permutation,以返回一个新数组。

np.apply_along_axis(np.random.permutation, axis=1, arr=s)

array([[ 3,  1,  0,  2],
       [ 4,  6,  5,  7],
       [ 8,  9, 10, 11],
       [15, 14, 13, 12]])

性能-

s = np.arange(10000 * 100).reshape(10000, 100) 

%timeit s[np.arange(len(s))[:,None], np.random.randn(*s.shape).argsort(axis=1)] 
%timeit np.apply_along_axis(np.random.permutation, 1, s)   

84.6 ms ± 857 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
842 ms ± 8.06 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

我注意到这取决于您数据的维度,请确保先进行测试。

答案 1 :(得分:0)

按代码方式,您可以将numpy的apply_along_axis用作

np.apply_along_axis(np.random.shuffle, 1, matrix)

但它似乎没有比至少对3x3矩阵进行迭代更有效的方法,对于这种方法,我得到

> %%timeit 
> np.apply_along_axis(np.random.shuffle, 1, test)
67 µs ± 1.8 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

而迭代给出

> %%timeit
> for i in range(test.shape[0]):
>     np.random.shuffle(test[i])
20.3 µs ± 284 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)