CudaMalloc()上的Cuda未知错误(错误:30)

时间:2015-03-07 19:04:55

标签: cuda malloc

我搜索了原因但没有运气。它失败了这么简单的程序:

#include <iostream>

using namespace std;

int main() {
  int* n;
  cout << cudaMallocManaged(&n, 4 * sizeof(int)) << endl;
  return 0;
}

返回码为30,未知错误。 cudaMalloc也失败了,代码相同。

这是我的硬件:

$ lspci | grep NV
01:00.0 3D controller: NVIDIA Corporation GF117M [GeForce 610M/710M/820M / GT 620M/625M/630M/720M] (rev a1)

$ nvidia-smi
Sat Mar  7 14:02:04 2015       
+------------------------------------------------------+                       
| NVIDIA-SMI 331.113    Driver Version: 331.113        |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  NVS 5200M           Off  | 0000:01:00.0     N/A |                  N/A |
| N/A   53C  N/A     N/A /  N/A |    279MiB /  1023MiB |     N/A      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Compute processes:                                               GPU Memory |
|  GPU       PID  Process name                                     Usage      |
|=============================================================================|
|    0            Not Supported                                               |
+-----------------------------------------------------------------------------+

我正在使用Ubuntu 14.10,来自官方存储库的CUDA 6.0(希望,如果Ubuntu不会搞砸它)。

这是一款Lenovo T430s labtop,该卡在Optimus上可能会导致一些问题。我已经在另一台机器上测试了相同的代码。

更新1

好的,nvidia_uvm未加载...

$ lsmod |grep nv

nvidia              10744914  65 
nvram                  14362  1 thinkpad_acpi
drm                   310919  6 i915,drm_kms_helper,nvidia

$ sudo modprobe nvidia_uvm
modprobe: ERROR: ../libkmod/libkmod-module.c:816 kmod_module_insert_module() could not find module by name='nvidia_331_updates_uvm'
modprobe: ERROR: could not insert 'nvidia_331_updates_uvm': Function not implemented

更新2

好的,我重新安装了nvidia-331-updates-uvm并加载了模块。

$ lsmod | grep nv
nvidia_uvm             34855  0 
nvidia              10744914  66 nvidia_uvm
nvram                  14362  1 thinkpad_acpi
drm                   310919  6 i915,drm_kms_helper,nvidia

但是,代码仍会返回错误30。

更新3

经过一些更多测试(主要尝试以root身份运行),现在我收到错误71:操作不受支持。但是,如果我只是使用cudaMalloc它就成功了。我还将检查我的设备是否支持统一内存寻址。

更新4

好的,我的卡只支持SM 2.1,所以它不支持统一内存。

1 个答案:

答案 0 :(得分:1)

CUDA需要AFAIK nvidia_uvm内核模块才能工作。

您需要安装包含该内核模块的软件包,例如: nvidia-331-uvm和 通过安装nvidia-modprobe

启用它的自动加载功能
sudo apt-get install nvidia-modprobe nvidia-331-uvm

如果您不想在安装nvidia-modprobe后重新启动,则可以尝试以root用户身份运行程序(例如sudo ./a.out) - 在root用户运行期间应加载模块。