我正在用手写数字在MNIST数据集上训练我的神经网络。我使用PyTorch,想知道使用5倍交叉验证(Kfold)时计算损失的正确方法是什么?我想绘制一个损耗图,比较火车损耗和测试损耗。
我正在使用交叉熵损失作为损失函数。我是否应该对每个时期的每个时期的损失进行平均?这样,如果我使用5个纪元,则损失图由5个数据点组成,其中第一个点对应于所有5折的第一个纪元的平均损失?
我还使用128的批处理大小。起初损失约为1,61,最后损失约为1,47。该模型的准确率为97.7%,损失的这种小幅下降是否很奇怪?