几个小时前,我成功完成了Theano + Keras GPU环境的运行。我甚至测试了一些代码以确保它在GPU上执行。但是,当我现在运行import theano
时,我收到以下错误:
ERROR (theano.gpuarray): Could not initialize pygpu, support disabled
Traceback (most recent call last):
.
.
.
.
GpuArrayException: cuDevicePrimaryCtxRetain: CUDA_ERROR_OUT_OF_MEMORY: out of memory
我在大学服务器上使用GPU,实验室中的许多学生共享它。该错误是否可能是由于其他正在运行的进程导致内存不足? nvidia-smi
的输出如下所示。使用PID 29586
的流程是我的。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 387.12 Driver Version: 387.12 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX TIT... Off | 00000000:01:00.0 On | N/A |
| 48% 83C P2 196W / 250W | 12152MiB / 12198MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 10977 C python 5506MiB |
| 0 24129 C python 6323MiB |
| 0 25238 G /usr/lib/xorg/Xorg 110MiB |
| 0 25773 G /usr/bin/gnome-shell 90MiB |
| 0 29586 C python 106MiB |
+-----------------------------------------------------------------------------+
GPU是Nvidia Titan X.我已经广泛搜索了这个错误,并且在过去的几个小时内尝试了很多方法。请帮忙。
答案 0 :(得分:2)
为了保持简单,是的,卡的内存不足。 TITAN X有12 GB的RAM,第一个进程几乎全部使用它。如果他们将其用于深度学习,可能会询问所有者是否可以停止他们的流程或使用较小的批量大小。