我正在培训CNN模型,用于正态分布数据的回归任务。
大多数数据点的值介于0.4和0.6之间。网络是否会学习数据点的特征,这些数据点小于0.4且大于0.6,而且代表性较低?
我也不想让分发统一,因为我希望网络能够学习培训数据的分布。
答案 0 :(得分:0)
模型学习你训练的任何东西。如果您使用某些特定类型的数据点进行更多训练,模型将很好地学习它们。在您的情况下,模型更有可能在0.4到0.6范围内的数据点上表现良好。模型在正常曲线尾部的数据点类型上表现更好的可能性更小。
为了让模型更好地了解正常曲线尾部的点,您需要扩充数据集以平衡它。您可以做的其他事情是对尾区的数据点使用加权损失。