tfdbg> “run -f has_inf_or_nan”似乎不起作用(培训期间NaN损失)

时间:2017-05-27 00:55:56

标签: python tensorflow

我正在使用tf.contrib.learn来拟合模型而我遇到了tensorflow.python.training.basic_session_run_hooks.NanLossDuringTrainingError: NaN loss during training.

当我尝试调试时,调试器不允许我检查在该错误期间发生了什么。相反,引发了异常。我的代码如下所示:

debug_hook = tf_debug.LocalCLIDebugHook()
debug_hook.add_tensor_filter("has_inf_or_nan", tf_debug.has_inf_or_nan)
hooks = [debug_hook]
...
classifier.fit(input_fn=get_train_inputs,
               steps=hyper_params['training_steps'],
               monitors=hooks)

使用的调试命令是

run -f has_inf_or_nan

Tensorflow 1.1。 Windows 10. Python 3.5。我的输入数据的形状为[600],其值在[0,1](含)范围内。从我的数据集的10000个样本子集开始。我正在尝试预测3000个输出类别。

知道什么是错的吗?

0 个答案:

没有答案