在深度学习中,我们应该根据列车/纬度损失和准确度选择最佳模型,但我怎么知道哪个点最好?
无论其他指标如何,它是否仅取决于val准确度?
还有两个相关问题:
最佳列车/纬度损失和精度曲线如何?
如果列车损失减少且列车准确度增加,我该怎么办?但是在长时间训练后,val精度会增加而val精度会停止增加?
看起来像这样:
答案 0 :(得分:1)
首先,您需要根据开发/验证数据集的结果选择模型。因此,val精度和val损失用于判断模型的性能。
在某种程度上,较高的val准确度通常与较低的val损失相关。那是因为你的损失用来衡量预测结果和地面实况之间的差异。
通过不同指标衡量的不同问题,就像我们经常在机器翻译中使用BLEU得分一样,您需要阅读一些关于您的研究领域的论文,以获得哪种指标受欢迎。
火车损失减少和val损失增加在模型训练中非常普遍,这通常意味着你的模型过度拟合。它学习的功能太多只出现在训练数据集中,而不是整个数据集中。
至于处理过度拟合,有很多方法,如早停,下拉层等。你可以谷歌它。