我需要在具有正态分布的数据上训练我的网络,我注意到我的神经网络非常倾向于仅预测我导出的csv文件中最常出现的类标签(将其预测与实际标签)。
有什么建议(除了清理数据以产生均匀分布的训练数据),这有助于我的神经网络不去,只能预测最常出现的标签?
更新:只是想提一下,确实评论部分提出的建议是有效的。然而,我发现在我的NN中添加一个额外的层可以缓解这个问题。
答案 0 :(得分:0)
假设使用小批量训练NN,可以通过确保每个小批量均匀分布来模拟(而不是生成)均匀分布的训练数据。
例如,假设一个3级分类问题和一个小批量大小= 30,通过随机选择每个类别10个样本构建每个小批量(如有必要,重复)。