我需要同时在多个阵列上执行相同的shuffle。这些可能是大型阵列(多个GB),因此需要在适当的位置完成。一个更简单的例子:
在洗牌之前:
Arr1: [[1 2 3]
[4 5 6]]
Arr2: [0 1]
洗牌之后:
Arr1: [[4 5 6]
[1 2 3]]
Arr2: [1 0]
答案 0 :(得分:1)
这是我找到的最佳解决方案:
from numpy.random import RandomState
import sys
def shuffleDataAndLabelsInPlace ( arr1, arr2):
seed = random.randint(0, sys.maxint)
prng = RandomState(seed)
prng.shuffle(arr1)
prng = RandomState(seed)
prng.shuffle(arr2)
# Example:
arr1= np.array([[1,2,3],[4,5,6]])
labels = np.array([0, 1])
print "Before shuffle"
print arr1
print arr2
print "After"
shuffleDataAndLabelsInPlace(arr1, arr2)
print arr1
print arr2
(提供与原始问题相同的输出)