我创建了一个包含25个输入,3个输出类和两个隐藏层的ANN。每次我在完整数据集上训练模型时,它都会收敛到一个总是输出最常见结果张量的配置:[0,0,1]。当我过滤训练数据以便所有三个输出被均等地表示时,ANN仍然会收敛到具有33%准确度的模型,并且紧贴到一个输出。
我的数据集已被证明具有相关性,因此这不是问题。数据在会话之前被洗牌,因此订单偏差绝对不是一个因素。我尝试使用tf.reduce_mean和tf.reduce_max作为成本函数,并将AdamOptimizer和RMSPropOptimizer作为优化器,但无济于事。当我使用学习速率,批量大小和图层大小时,问题仍然存在。是否存在可以解决我的问题的成本函数或优化器,或者可能是以不同方式处理我的数据的方法?