nvidia-smi不显示内存使用情况

时间:2017-05-28 13:20:30

标签: machine-learning tensorflow gpu nvidia

我想使用nvidia-smi来监控我的机器学习/ AI项目的GPU。但是,当我在我的cmd,git bash或powershell中运行nvidia-smi时,我得到以下结果:

$ nvidia-smi
Sun May 28 13:25:46 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 376.53                 Driver Version: 376.53                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070   WDDM  | 0000:28:00.0      On |                  N/A |
|  0%   49C    P2    36W / 166W |   7240MiB /  8192MiB |      4%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      7676  C+G   ...ost_cw5n1h2txyewy\ShellExperienceHost.exe N/A      |
|    0      8580  C+G   Insufficient Permissions                     N/A      |
|    0      9704  C+G   ...x86)\Google\Chrome\Application\chrome.exe N/A      |
|    0     10532    C   ...\Anaconda3\envs\tensorflow-gpu\python.exe N/A      |
|    0     11384  C+G   Insufficient Permissions                     N/A      |
|    0     12896  C+G   C:\Windows\explorer.exe                      N/A      |
|    0     13868  C+G   Insufficient Permissions                     N/A      |
|    0     14068  C+G   Insufficient Permissions                     N/A      |
|    0     14568  C+G   Insufficient Permissions                     N/A      |
|    0     15260  C+G   ...osoftEdge_8wekyb3d8bbwe\MicrosoftEdge.exe N/A      |
|    0     16912  C+G   ...am Files (x86)\Dropbox\Client\Dropbox.exe N/A      |
|    0     18196  C+G   ...I\AppData\Local\hyper\app-1.3.3\Hyper.exe N/A      |
|    0     18228  C+G   ...oftEdge_8wekyb3d8bbwe\MicrosoftEdgeCP.exe N/A      |
|    0     20032  C+G   ...indows.Cortana_cw5n1h2txyewy\SearchUI.exe N/A      |
+-----------------------------------------------------------------------------+

GPU Memory Usage为每个进程显示N/A。此外,列出的进程比我在Internet上的大多数示例中找到的要多得多。这可能是什么原因?

我正在运行华硕的Nvidia GTX 1070,我的操作系统是Windows 10 Pro。

1 个答案:

答案 0 :(得分:8)

如果您执行以下操作:nvidia-smi -q,您会看到以下内容:

Processes
        Process ID                  : 6564
            Type                    : C+G
            Name                    : C:\Windows\explorer.exe
            Used GPU Memory         : Not available in WDDM driver model

在WDDM驱动程序型号中不可用=> WDDM代表 Windows显示驱动程序模型。您可以使用以下命令切换到TCC并获取信息:nvidia-smi -dm 1,但只有在GPU没有连接任何显示器时才能执行此操作。所以...它几乎不可能......

顺便说一下,不要担心高内存使用率,Tensorflow会尽可能多地保留GPU内存来加速其进程。如果您更喜欢对所占用的内存进行更细粒度的控制,请使用以下内容(它可能会减慢您的计算速度):

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(config=config)

您可以在Ubuntu上创建双启动,或者忘掉这一点。