应用错误收集

我正在用手写数字在MNIST数据集上训练我的神经网络。我使用PyTorch，想知道使用5倍交叉验证（Kfold）时计算损失的正确方法是什么？我想绘制一个损耗图，比较火车损耗和测试损耗。

我正在使用交叉熵损失作为损失函数。我是否应该对每个时期的每个时期的损失进行平均？这样，如果我使用5个纪元，则损失图由5个数据点组成，其中第一个点对应于所有5折的第一个纪元的平均损失？

我还使用128的批处理大小。起初损失约为1,61，最后损失约为1,47。该模型的准确率为97.7％，损失的这种小幅下降是否很奇怪？