我正在使用tf.contrib.learn来拟合模型而我遇到了tensorflow.python.training.basic_session_run_hooks.NanLossDuringTrainingError: NaN loss during training.
当我尝试调试时,调试器不允许我检查在该错误期间发生了什么。相反,引发了异常。我的代码如下所示:
debug_hook = tf_debug.LocalCLIDebugHook()
debug_hook.add_tensor_filter("has_inf_or_nan", tf_debug.has_inf_or_nan)
hooks = [debug_hook]
...
classifier.fit(input_fn=get_train_inputs,
steps=hyper_params['training_steps'],
monitors=hooks)
使用的调试命令是
run -f has_inf_or_nan
Tensorflow 1.1。 Windows 10. Python 3.5。我的输入数据的形状为[600],其值在[0,1](含)范围内。从我的数据集的10000个样本子集开始。我正在尝试预测3000个输出类别。
知道什么是错的吗?