Lua / Torch:将MNIST数据集拆分为训练和测试,每组中标签数量相等

时间:2016-02-03 23:47:48

标签: lua deep-learning torch mnist

我试图将数据分成训练(80%)和测试(20%)设置,但我需要先将数据混洗,然后为每个标签(y,10个类)分配相同数量的样本数据集。

我怎么能在lua / torch中这样做?谢谢!

到目前为止,这是我的代码......

loaded = torch.load(data_file, 'ascii')
Data = {
data = loaded.data,
labels = loaded.labels,
size = 60000
}



Data.data:nDimension()
4

Data.labels:nDimension()
1

Data.data:size()
 60000
 1
32
32
[torch.LongStorage of size 4]

validationData.labels:size()
 60000
[torch.LongStorage of size 1]

1 个答案:

答案 0 :(得分:0)

你可以做下面的事情来洗牌;

    dataSize = Data.data:size()[1]
    shuffleIdx = torch.randperm(dataSize)
    Data.data = Data.data:index(1,shuffleIdx:long())
    Data.labels = Data.labels:index(1,shuffleIdx:long())

但我不确定你问题的第二部分。