我有一些非常大的数据集,我想加载到Torch中。但在运行学习算法之前,我无法将它们完全加载到内存中。
我应该怎样做才能最大限度地提升表现?
答案 0 :(得分:6)
查看imagenet-multiGPU.torch全栈示例代码。它包含一个数据加载器(dataset.lua
),能够一次采样一批图像,防止在内存中预加载所有内容:
local inputs, labels = trainLoader:sample(opt.batchSize)
(有关详细信息,请参阅train.lua
)