我正在训练一个进行图像字幕的模型。我注意到我的模型在第一个时期获得了很高的训练准确性(约89%)以及验证准确性。实际上,训练精度从第一个时期开始就在很高的点上开始,大约从%60开始,然后很快就上升到%80。这对我来说没有意义,因为模型在开始时就以非常高的精度学习得非常快。 Here is a screenshot of the output
答案 0 :(得分:1)
如果在装配过程中使用小批量生产,则可以观察每次迭代过程中的精度和损耗变化。您的前几个小批处理可能会很糟糕,然后如果优化程序找到了合理的局部最小值,就会跳到中途。我经常发生这种情况;这很大程度上取决于我使用的优化程序,模型的大小以及数据量。就其本身而言,这不一定是一件坏事。但是一定要检查一下测试仪是否过拟合。