使用Tensorboard在Watson Studio中运行HPO时未记录我的指标

时间:2018-07-13 16:14:45

标签: tensorboard watson-studio

我正在使用Watson Studio的HPO功能训练一个简单的MLP。但是,当查看我的日志时,指标不会显示。指标日志记录在运行非HPO训练运行时有效,但在HPO中运行时则不显示日志。

这是我定义Tensorboard回调的方式:

tb_directory = os.path.join(os.environ["JOB_STATE_DIR"], "logs", "tb", 
os.makedirs(tb_directory, exist_ok=True)
tensorboard = TensorBoard(log_dir=tb_directory)

history = model.fit(x_train, y_train,
                    batch_size=batch_size,
                    epochs=epochs,
                    validation_data=(x_test, y_test),
                    callbacks=[tensorboard])

1 个答案:

答案 0 :(得分:1)

找到了答案。运行HPO时,每次训练的指标必须放置在其自己的子目录中,否则将被覆盖。所以我应该像这样设置我的Tensorboard日志目录:

tb_directory = os.path.join(os.environ["SUBID"],os.environ["JOB_STATE_DIR"], "logs", "tb",