应用错误收集

我正在使用Tensorflow RNN来预测一堆序列。我使用Grucell和dynamic_rnn。在培训时，我输入了训练数据集，我将其分为8个批次，每个批次的批量大小为10（1个批次的形状为[10, 6, 2]，即[batchsize, seqlen, dim]）。为了防止过度拟合，我在训练数据集中的预测率开始超过80％时停止训练（通常在80％~83％的准确率下停止）。

训练之后，我让相同的图表只预测（不训练）相同的训练数据集。但这次，由于tf.nn.dynamic_rnn可以提供可变大小的批量，我可以将数据集定制为80批次，每批次的批量大小为1，形状为{{1 （简单地降低了批量大小，因此增加了批次数）。然后，准确度通常超过90％，这明显高于80％。出于某种原因，缩小批量大小会导致更高的准确率。为什么会这样？

Rnn预测率受批量大小影响？

1 个答案: