我花了很多时间试图弄清楚这个问题的原因。以下代码尝试使用curand
上的device
生成一系列正态分布的随机变量。它似乎成功生成了一些,但随后遇到了非法内存地址崩溃错误"。非常感谢任何帮助。
#include <stdio.h>
#include <cuda.h>
#include <curand_kernel.h>
class A {
public:
__device__ A(const size_t& seed) {
printf("\nA()");
curandState state;
curand_init(seed, 0, 0, &state);
for(size_t i = 0; i < 1000; ++i)
printf("\n%f", curand_normal(&state));
}
__device__ ~A() { printf("\n~A()"); }
};
/// Kernel
__global__ void kernel(const size_t& seed) {
printf("\nHello from Kernel...");
A a(seed);
return;
}
int main(void) {
kernel<<<1,1>>>(1);
cudaError_t cudaerr = cudaDeviceSynchronize();
if (cudaerr != CUDA_SUCCESS)
printf("kernel launch failed with error \"%s\".\n",
cudaGetErrorString(cudaerr));
return 0;
}
Hello from Kernel...
A()
0.292537
-0.718359
0.958011
0.633711kernel launch failed with error "an illegal memory access was encountered".
我已经在我的机器(CUDA 7.0)和超级计算群集(CUDA 6.5)上运行了这个,同样的结果展开了。
答案 0 :(得分:3)
删除内核参数(&
)的传递引用。
你是not allowed to write GPU kernels that have pass-by-reference parameters。 GPU内核无法修改主机变量。 (忽略统一内存,零拷贝和相关机制,这里没有问题。)