我改用高性能GPU群集(Debian)来训练我的CNN。我使用由本地计算中心提供的张量流奇异图像。因为这可能很重要,所以作业是通过slurm提交的。
在本地计算机上,可以使用(Windows-)命令行通过
访问张量板tensorboard --logdir=PATH\TO\DIR
并在浏览器中查看统计信息(即在http://computer-name:6006/处)。
但是,在集群上训练时,我尚未设法访问张量板。
有没有人建议如何在(GPU)集群上运行和访问tensorboard来监督NN训练?提前谢谢。