我正在研究Tensorflow for poets教程。大多数情况下,培训失败并出现错误Nan in summary histogram
。
我对原始数据运行以下命令进行重新训练:
python -m scripts.retrain
--bottleneck_dir=tf_files/bottlenecks
--model_dir=tf_files/models/
--summaries_dir=tf_files/training_summaries/"${ARCHITECTURE}"
--output_graph=tf_files/retrained_graph.pb
--output_labels=tf_files/retrained_labels.txt
--image_dir=/ml/data/images
此错误也发生在other mentions中。我按照那里的说明使用tfdg给了我更多的见解(见下文)。然而,我仍然被卡住,因为我不知道为什么会发生这种情况,以及如果没有TF和神经网络的经验,我可以做些什么来修复它。这尤其令人困惑,因为它发生在100%的教程代码和数据
这是tfdg的输出。第一次出现错误:
要查看重新训练脚本,您可以找到Google的原始代码here。它没有在我的情况下修改。很抱歉不包括它(字符太多)。
超级参数&结果 有关其他信息:培训适用于学习率的可笑小值(例如,使用0,000001)。然而,这不会带来好的结果。无论我训练了多少个时代,性能都保持在低水平(在优化过程中可能会陷入局部最小值)。
答案 0 :(得分:1)
您确定要创建tf_files文件夹吗? 我在命令行python上面临一些问题。我切换到spyder并根据retrain.py中的要求更改了输入的可变数据,它运行顺畅。我知道,这不是一个解决方案,而是一个转机。
答案 1 :(得分:1)
我已经搜索了兼容性,因为我在2.7中也做了,但它说3.5是最好的版本,现在有所有最新的tensorflow支持。所以我用python 3.5创建了虚拟环境。我认为这就是稳定性问题的原因。