我开始学习CUDA。我写了计算阶乘的程序。代码正在运行但是当我计算因子更多时我得到的错误值。为什么CUDA获得无效价值?如何解决这个问题? 这是我的代码。
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <conio.h>
#define CUPRINTF cuPrintf
__device__ int silnia(int n)
{
if (n<2)
return 1; //silnia z 0 i 1 wynosi 1
return n*silnia(n - 1);
}
__global__ void kernel(int *a)
{
*a = silnia(15);
}
int main()
{
cudaEvent_t start, stop;
float elapsedTime;
cudaEventCreate(&start);
cudaEventRecord(start, 0);
int *dev_a,a;
cudaEventRecord(start);
cudaMalloc((void**)&dev_a, sizeof(int));
kernel << <1, 1 >> >(dev_a);
cudaMemcpy(&a, dev_a, sizeof(int), cudaMemcpyDeviceToHost);
cudaEventCreate(&stop);
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
cudaEventElapsedTime(&elapsedTime, start, stop);
printf("Elapsed time : %f ms\n", elapsedTime);
printf("%d", a);
getch();
return 0;
}
寻求帮助。
答案 0 :(得分:4)
12阶乘是479001600,它符合int
变量。
13 factorial是6227020800,不适合int
变量。
如果您将int
更改为unsigned long long
(无处不在,包括您的printf
格式说明符),您将获得更多范围,但最终会超出范围。< / p>
答案 1 :(得分:1)
仅仅因为有#34;溢出&#34;。如果你继续使用&#34; int&#34;你无法解决问题;)