如果我在Google Cloud ML Engine作业中使用--scale-tier BASIC GPU,我该如何查看GPU利用率?我能够在“作业详细信息”选项卡上查看CPU利用率和内存利用率,但我想知道GPU的使用量。这仅仅包含在CPU使用率中还是有另一个选项卡来查看GPU利用率?
此外,有没有办法查看哪些操作占用了大部分CPU?我的CPU利用率非常高,我的内存非常低,我的输入生产商总是满(100%),所以我试图更好地了解花费的时间,以便我可以尝试优化我的模型性能
答案 0 :(得分:3)
目前无法通过Cloud ML Engine查看GPU利用率。
TensorFlow有一个称为时间轴的功能,可用于获取配置文件数据。这是一个描述如何使用它的blog post。
答案 1 :(得分:0)
watch -n 0.5 nvidia-smi
来查看NVIDIA GPU的使用情况。