如何消除我的训练数据分布对后续神经网络分类函数的巨大负面影响?

时间:2016-04-03 01:36:32

标签: python machine-learning neural-network

我需要在具有正态分布的数据上训练我的网络,我注意到我的神经网络非常倾向于仅预测我导出的csv文件中最常出现的类标签(将其预测与实际标签)。

有什么建议(除了清理数据以产生均匀分布的训练数据),这有助于我的神经网络不去,只能预测最常出现的标签?

更新:只是想提一下,确实评论部分提出的建议是有效的。然而,我发现在我的NN中添加一个额外的层可以缓解这个问题。

1 个答案:

答案 0 :(得分:0)

假设使用小批量训练NN,可以通过确保每个小批量均匀分布来模拟(而不是生成)均匀分布的训练数据。

例如,假设一个3级分类问题和一个小批量大小= 30,通过随机选择每个类别10个样本构建每个小批量(如有必要,重复)。