标签: gpu monitoring nvidia
我正在运行NVidia多GPU环境,并想实时监视性能指标:
最后,这应该是机器可读的(例如prometheus),但我想我可以解决这个问题。
有几个不同的应用程序正在运行,而且我无法破解代码,因此进入CUDA并不是一种选择。
据我所知,其他非选择是:
nvprof
nvidia-smi dmon