我有四个RTX2080 GPU,我想在以下代码中启用从设备1到设备0的对等访问。
cudaSetDevice(0);
float* data;
cudaMalloc(&data, 1000 * sizeof(float));
cudaSetDevice(1);
cudaDeviceEnablePeerAccess(0, 0); // This will fail with error: cudaErrorPeerAccessUnsupported
我检查了unifiedAddressing
中的cudaDeviceProp
,值是1。我的代码有什么问题吗?
这是我的GPU连接的拓扑:
GPU0 GPU1 GPU2 GPU3
GPU0 X NODE SYS SYS
GPU1 NODE X SYS SYS
GPU2 SYS SYS X NODE
GPU3 SYS SYS NODE X
驱动程序版本:430.40
CUDA版本:10.1