我正在训练神经网络来预测一个连续值。所以我的问题是回归问题,应该很简单,我具有3个或4个特征,并且我要预测的目标是角度值,所以介于0到360之间。为此,我使用pytorch / skorch,我认为是一个非常酷的API,我在将功能馈送到网络之前对其进行了标准化/标准化,我尝试了不同的体系结构,不同的超参数等。但是我注意到网络开始学习的很好,因此损耗开始以良好的方式降低,但是当达到6000或7000时,它以某种方式卡在了那里,网络很难继续学习。现在,我不知道为什么会这样,我正在寻求建议或指导。我确定我的代码中没有错误,因为我尝试仅拟合数据集中的10个数据点,并且该方法有效(NN实现了对这10个样本的过度拟合),但是当我获取包含10000个数据点的整个数据集时,网络停滞在那个高损失值上,并且很难进行进一步的训练,我不确定是什么原因造成的,我的意思是至少神经网络应该过度拟合训练数据,但是我的网络甚至都无法实现过度拟合。任何人都请知道导致这种行为的原因可能是什么,或者我可以尝试除批处理规范化,更复杂的体系结构,不同的超参数之外的其他方法?