听到完整的n00b的道歉,但我已经知道我可以将CUDA扩展函数调用到C ++并让GPU计算。但是,我似乎无法找到如何下载库的说明(我需要下载哪个库)?奇怪的是,我有一个很好的例子,但我不知道如何获得这些库!
所以我的帖子更有用,这是我希望实现的例子:
#define N 512
int main(void) {
int *a, *b, *c; // host copies of a, b, c
int *d_a, *d_b, *d_c; // device copies of a, b, c
int size = N * sizeof(int);
// Alloc space for device copies of a, b, c
cudaMalloc((void **)&d_a, size);
cudaMalloc((void **)&d_b, size);
cudaMalloc((void **)&d_c, size);
// Alloc space for host copies of a, b, c and setup input values
a = (int *)malloc(size); random_ints(a, N);
b = (int *)malloc(size); random_ints(b, N);
c = (int *)malloc(size);
// Copy inputs to device
cudaMemcpy(d_a, a, size, cudaMemcpyHostToDevice);
cudaMemcpy(d_b, b, size, cudaMemcpyHostToDevice);
// Launch add() kernel on GPU with N blocks
add<<<N,1>>>(d_a, d_b, d_c);
// Copy result back to host
cudaMemcpy(c, d_c, size, cudaMemcpyDeviceToHost);
// Cleanup
free(a); free(b); free(c);
cudaFree(d_a); cudaFree(d_b); cudaFree(d_c);
return 0;
}
答案 0 :(得分:1)
您可以在此处找到Cuda SDK:Cuda SDK
说实话并不是很难......但是,如果你将来遇到这种问题,你通常会通过搜索它的名字(这里是Cuda)找到库,然后是“SDK” “在Google上。应始终在第一个结果中。
如果你想开始使用,我认为NVIDIA提供了一个非常好的文档以及一个入门部分,包括对并行编程的介绍:Getting Started