GCE上100%的GPU利用率,无需任何处理

时间:2018-10-11 11:57:47

标签: gpu google-compute-engine nvidia tesla

我刚刚在带有2个GPU(Nvidia Tesla K80)的Google Compute Engine上启动了一个实例。在开始之后,马上就可以通过nvidia-smi看到其中之一已经被充分利用。

我检查了一个正在运行的进程的列表,根本没有任何运行。这是否意味着Google已将同一GPU出租给其他人?

enter image description here

这一切都在此计算机上运行:

No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 16.04.5 LTS
Release:    16.04
Codename:   xenial

enter image description here

2 个答案:

答案 0 :(得分:3)

使用mkdir -p android/app/src/main/assets && rm -rf android/app/build && react-native bundle --platform android --dev false --entry-file index.js --bundle-output android/app/src/main/assets/index.android.bundle --assets-dest android/app/src/main/res && cd android && ./gradlew assembleDebug启用“持久模式”可能会解决此问题。 ECC与非持久性模式结合可以导致100%的GPU利用率。

或者,您也可以使用nvidia-smi -pm 1禁用ECC。

注意:我不确定性能是否实际上更差。我可以记住,尽管GPU利用率为100%,但我仍能够训练ML模型,但我不知道它是否更慢。

答案 1 :(得分:0)

我建议您根据需要进行报告并在Google Issue Tracker上创建此问题。请在那边提供您的项目编号和实例名称。请遵循此URL,使您能够在Google Issue Tracker中创建私有文件。