通过输入排列进行数据增强

时间:2021-07-22 18:51:32

标签: python tensorflow keras generator

我的模型将 4 个数组作为输入,并通过以下方式使用标准 keras 拟合函数进行训练:

model.fit([train[0],train[1],train[2],train[3]], train_labels)

这 4 个数组具有相同的维度,实际上它们是可以互换的。 字典“train”被加载到 RAM 中。 为了克服严重的过度拟合并提高模型的性能,我想将数据集增强 24 倍,即 [1,2,3,4] 的所有可能排列数的 24。 此外,我想以一种节省空间的方式来做:不要将它写入磁盘,然后在训练模型时加载它。 我可以在数据集上使用 itertools.permutations,因为我无法承受在 RAM 中拥有比起始数据集大 24 倍的数据集。 有没有办法使用某种自定义数据生成器来做到这一点?

0 个答案:

没有答案