应用错误收集

我正在训练神经网络来预测一个连续值。所以我的问题是回归问题，应该很简单，我具有3个或4个特征，并且我要预测的目标是角度值，所以介于0到360之间。为此，我使用pytorch / skorch，我认为是一个非常酷的API，我在将功能馈送到网络之前对其进行了标准化/标准化，我尝试了不同的体系结构，不同的超参数等。但是我注意到网络开始学习的很好，因此损耗开始以良好的方式降低，但是当达到6000或7000时，它以某种方式卡在了那里，网络很难继续学习。现在，我不知道为什么会这样，我正在寻求建议或指导。我确定我的代码中没有错误，因为我尝试仅拟合数据集中的10个数据点，并且该方法有效（NN实现了对这10个样本的过度拟合），但是当我获取包含10000个数据点的整个数据集时，网络停滞在那个高损失值上，并且很难进行进一步的训练，我不确定是什么原因造成的，我的意思是至少神经网络应该过度拟合训练数据，但是我的网络甚至都无法实现过度拟合。任何人都请知道导致这种行为的原因可能是什么，或者我可以尝试除批处理规范化，更复杂的体系结构，不同的超参数之外的其他方法？

训练时神经网络陷入高损耗的原因可能是什么

0 个答案: