给定矩阵A,我想对A的不同行应用不同的随机洗牌;例如
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
成为
array([[1, 3, 2],
[6, 5, 4],
[7, 9, 8]])
当然,我们可以循环遍历矩阵,并使每一行随机洗牌;但是迭代很慢,我在问是否有更有效的方法可以做到这一点。
答案 0 :(得分:2)
从Divakar那里挑选了一个巧妙的技巧,涉及randn
和argsort
:
np.random.seed(0)
s = np.arange(16).reshape(4, 4)
np.take_along_axis(s, np.random.randn(*s.shape).argsort(axis=1), axis=1)
array([[ 1, 0, 3, 2],
[ 4, 6, 5, 7],
[11, 10, 8, 9],
[14, 12, 13, 15]])
对于2D阵列,可以简化为
s[np.arange(len(s))[:,None], np.random.randn(*s.shape).argsort(axis=1)]
array([[ 1, 0, 3, 2],
[ 4, 6, 5, 7],
[11, 10, 8, 9],
[14, 12, 13, 15]])
您还可以在每行上单独应用np.random.permutation
,以返回一个新数组。
np.apply_along_axis(np.random.permutation, axis=1, arr=s)
array([[ 3, 1, 0, 2],
[ 4, 6, 5, 7],
[ 8, 9, 10, 11],
[15, 14, 13, 12]])
性能-
s = np.arange(10000 * 100).reshape(10000, 100)
%timeit s[np.arange(len(s))[:,None], np.random.randn(*s.shape).argsort(axis=1)]
%timeit np.apply_along_axis(np.random.permutation, 1, s)
84.6 ms ± 857 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
842 ms ± 8.06 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
我注意到这取决于您数据的维度,请确保先进行测试。
答案 1 :(得分:0)
按代码方式,您可以将numpy的apply_along_axis
用作
np.apply_along_axis(np.random.shuffle, 1, matrix)
但它似乎没有比至少对3x3矩阵进行迭代更有效的方法,对于这种方法,我得到
> %%timeit
> np.apply_along_axis(np.random.shuffle, 1, test)
67 µs ± 1.8 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
而迭代给出
> %%timeit
> for i in range(test.shape[0]):
> np.random.shuffle(test[i])
20.3 µs ± 284 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)