Tensorflow:具有logits的Softmax交叉熵变为inf

时间:2018-02-19 15:05:47

标签: tensorflow histogram

我正在研究Tensorflow for poets教程。大多数情况下,培训失败并出现错误Nan in summary histogram。 我对原始数据运行以下命令进行重新训练:

python -m scripts.retrain   
   --bottleneck_dir=tf_files/bottlenecks   
   --model_dir=tf_files/models/   
   --summaries_dir=tf_files/training_summaries/"${ARCHITECTURE}"   
   --output_graph=tf_files/retrained_graph.pb   
   --output_labels=tf_files/retrained_labels.txt  
   --image_dir=/ml/data/images

此错误也发生在other mentions中。我按照那里的说明使用tfdg给了我更多的见解(见下文)。然而,我仍然被卡住,因为我不知道为什么会发生这种情况,以及如果没有TF和神经网络的经验,我可以做些什么来修复它。这尤其令人困惑,因为它发生在100%的教程代码和数据

这是tfdg的输出。第一次出现错误:

tfdg output for the node with the error 节点详细说明:

enter image description here

要查看重新训练脚本,您可以找到Google的原始代码here。它没有在我的情况下修改。很抱歉不包括它(字符太多)。

超级参数&结果 有关其他信息:培训适用于学习率的可笑小值(例如,使用0,000001)。然而,这不会带来好的结果。无论我训练了多少个时代,性能都保持在低水平(在优化过程中可能会陷入局部最小值)。

2 个答案:

答案 0 :(得分:1)

您确定要创建tf_files文件夹吗? 我在命令行python上面临一些问题。我切换到spyder并根据retrain.py中的要求更改了输入的可变数据,它运行顺畅。我知道,这不是一个解决方案,而是一个转机。

答案 1 :(得分:1)

我已经搜索了兼容性,因为我在2.7中也做了,但它说3.5是最好的版本,现在有所有最新的tensorflow支持。所以我用python 3.5创建了虚拟环境。我认为这就是稳定性问题的原因。