我对如何选择包含M个点训练1-NN分类,因为原来的训练点的数量太大MNIST训练集的一个子集的麻烦。
也就是说,我需要弄清楚,需要输入一个标记的训练集,以及一个数M的方案,并返回一个subset.of尺寸M的训练集。
此外,不允许进行均匀随机选择((即,随机选择M个训练点)
答案 0 :(得分:0)
一种选择是使用数据生成器训练网络。 它仅加载一批数据。您的数据将不再有问题。此外,它能够使用多线程。 因此,装载也许预处理你的数据不会成为瓶颈。
这是一个很好的例子: https://stanford.edu/~shervine/blog/keras-how-to-generate-data-on-the-fly
我希望这会有所帮助。