如何防止TensorFlow ANN收敛到单个输出

时间:2016-08-11 17:26:58

标签: neural-network tensorflow

我创建了一个包含25个输入,3个输出类和两个隐藏层的ANN。每次我在完整数据集上训练模型时,它都会收敛到一个总是输出最常见结果张量的配置:[0,0,1]。当我过滤训练数据以便所有三个输出被均等地表示时,ANN仍然会收敛到具有33%准确度的模型,并且紧贴到一个输出。

我的数据集已被证明具有相关性,因此这不是问题。数据在会话之前被洗牌,因此订单偏差绝对不是一个因素。我尝试使用tf.reduce_mean和tf.reduce_max作为成本函数,并将AdamOptimizer和RMSPropOptimizer作为优化器,但无济于事。当我使用学习速率,批量大小和图层大小时,问题仍然存在。是否存在可以解决我的问题的成本函数或优化器,或者可能是以不同方式处理我的数据的方法?

0 个答案:

没有答案