应用错误收集

我创建了一个包含25个输入，3个输出类和两个隐藏层的ANN。每次我在完整数据集上训练模型时，它都会收敛到一个总是输出最常见结果张量的配置：[0,0,1]。当我过滤训练数据以便所有三个输出被均等地表示时，ANN仍然会收敛到具有33％准确度的模型，并且紧贴到一个输出。

我的数据集已被证明具有相关性，因此这不是问题。数据在会话之前被洗牌，因此订单偏差绝对不是一个因素。我尝试使用tf.reduce_mean和tf.reduce_max作为成本函数，并将AdamOptimizer和RMSPropOptimizer作为优化器，但无济于事。当我使用学习速率，批量大小和图层大小时，问题仍然存在。是否存在可以解决我的问题的成本函数或优化器，或者可能是以不同方式处理我的数据的方法？

如何防止TensorFlow ANN收敛到单个输出

0 个答案: