我正在使用lstm模型。我了解小批量生产对于训练模型的意义。基本上,它与批量更新梯度有关,而不是与每次采样后更新有关。但是最小批量大小在预测阶段意味着什么。我无法理解批量大小在预测阶段的作用。更改它会影响我的结果吗?
答案 0 :(得分:0)
批处理的概念比计算梯度更笼统。大多数神经网络框架都允许您将一批图像输入到网络中,而这样做是因为它效率更高且可以轻松地与GPU并行化。
增加或减少用于预测的批次大小通常仅影响计算效率,而不影响结果。仅在具有状态的LSTM这样的状态模型(不是正常的LSTM)的情况下,您才能获得随批大小而变化的结果。
答案 1 :(得分:0)
批量大小等仅与学习有关。模型学习(训练)后,将仅保存权重。在测试或预测时,将仅使用保存的权重进行预测。
默认情况下,香草LSTM会在批处理大小之后重置单元状态,但是您可以更改它。可以使其在一个时期后更新状态,甚至保持所有状态。