是否有可能在多个numpy数组上执行相同的shuffle?

时间:2017-04-22 01:01:00

标签: python numpy

我需要同时在多个阵列上执行相同的shuffle。这些可能是大型阵列(多个GB),因此需要在适当的位置完成。一个更简单的例子:

在洗牌之前:

Arr1: [[1 2 3]
       [4 5 6]]
Arr2: [0 1]

洗牌之后:

Arr1: [[4 5 6]
       [1 2 3]]
Arr2: [1 0]

1 个答案:

答案 0 :(得分:1)

这是我找到的最佳解决方案:

from numpy.random import RandomState
import sys

def shuffleDataAndLabelsInPlace ( arr1, arr2):
    seed = random.randint(0, sys.maxint)
    prng = RandomState(seed)
    prng.shuffle(arr1)
    prng = RandomState(seed)
    prng.shuffle(arr2)

# Example:
arr1= np.array([[1,2,3],[4,5,6]])
labels = np.array([0, 1])

print "Before shuffle"
print arr1
print arr2
print "After"
shuffleDataAndLabelsInPlace(arr1, arr2)
print arr1
print arr2

(提供与原始问题相同的输出)