Question

我正在研究Tensorflow for poets教程。大多数情况下，培训失败并出现错误Nan in summary histogram。我对原始数据运行以下命令进行重新训练：

python -m scripts.retrain   
   --bottleneck_dir=tf_files/bottlenecks   
   --model_dir=tf_files/models/   
   --summaries_dir=tf_files/training_summaries/"${ARCHITECTURE}"   
   --output_graph=tf_files/retrained_graph.pb   
   --output_labels=tf_files/retrained_labels.txt  
   --image_dir=/ml/data/images

此错误也发生在other mentions中。我按照那里的说明使用tfdg给了我更多的见解（见下文）。然而，我仍然被卡住，因为我不知道为什么会发生这种情况，以及如果没有TF和神经网络的经验，我可以做些什么来修复它。这尤其令人困惑，因为它发生在100％的教程代码和数据

这是tfdg的输出。第一次出现错误：

节点详细说明：

要查看重新训练脚本，您可以找到Google的原始代码here。它没有在我的情况下修改。很抱歉不包括它（字符太多）。

超级参数＆amp;结果 有关其他信息：培训适用于学习率的可笑小值（例如，使用0,000001）。然而，这不会带来好的结果。无论我训练了多少个时代，性能都保持在低水平（在优化过程中可能会陷入局部最小值）。

Answer 1

您确定要创建tf_files文件夹吗？我在命令行python上面临一些问题。我切换到spyder并根据retrain.py中的要求更改了输入的可变数据，它运行顺畅。我知道，这不是一个解决方案，而是一个转机。

Answer 2

我已经搜索了兼容性，因为我在2.7中也做了，但它说3.5是最好的版本，现在有所有最新的tensorflow支持。所以我用python 3.5创建了虚拟环境。我认为这就是稳定性问题的原因。

Tensorflow：具有logits的Softmax交叉熵变为inf

2 个答案: