如果我想用train_generator训练模型,那么选择之间是否存在显着差异
和
目前我正在训练10个时代,因为每个时代都需要很长时间,但任何显示出改进的图表看起来非常"跳跃"因为我只有10个数据点。如果我使用100个Epochs,我想我可以得到更平滑的图形,但我想首先知道这是否有任何缺点
答案 0 :(得分:4)
根据你说的话,你需要一个更大的batch_size
,当然会有影响step_per_epoch和时代数的影响。
解决跳跃问题
较大批量的含义
何时减少时期
何时调整每个步骤的步数
答案 1 :(得分:0)
每个纪元的步数不会连接到纪元。
当然,你想要的1个纪元,你的发电机一次通过你所有的训练数据。要实现这一目标,您应该提供每个时期的步数等于这样的批次数:
steps_per_epoch = int( np.ceil(x_train.shape[0] / batch_size) )
从上面的等式中batch_size
最大,steps_per_epoch
越低。
接下来,您将根据所选验证选择纪元。 (选择你认为最好的)
答案 2 :(得分:0)
每个时期的步骤数表示一个时期要选择的批次数量。 如果选择了500个步骤,则网络将训练500个批次以完成一个时期。 如果我们选择大量的时期,那可能是计算性的