我正在使用Watson Studio的HPO功能训练一个简单的MLP。但是,当查看我的日志时,指标不会显示。指标日志记录在运行非HPO训练运行时有效,但在HPO中运行时则不显示日志。
这是我定义Tensorboard回调的方式:
tb_directory = os.path.join(os.environ["JOB_STATE_DIR"], "logs", "tb",
os.makedirs(tb_directory, exist_ok=True)
tensorboard = TensorBoard(log_dir=tb_directory)
history = model.fit(x_train, y_train,
batch_size=batch_size,
epochs=epochs,
validation_data=(x_test, y_test),
callbacks=[tensorboard])
答案 0 :(得分:1)
找到了答案。运行HPO时,每次训练的指标必须放置在其自己的子目录中,否则将被覆盖。所以我应该像这样设置我的Tensorboard日志目录:
tb_directory = os.path.join(os.environ["SUBID"],os.environ["JOB_STATE_DIR"], "logs", "tb",