我有这个非常简单的代码,nvcc需要很长时间才能编译(它会加载我的两个CPU内核100%而且永不停止)。这是由于某些循环展开吗?是否有更简单的方法来更快地初始化本地内存?
#include "cuda_runtime.h"
#include <stdio.h>
#include "cuComplex.h"
__global__ void test()
{
cuComplex myPoints[20][20];
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
myPoints[i][j].x=0.0;
myPoints[i][j].y=0.0;
}
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
printf("%d %d",myPoints[i][j].x,myPoints[i][j].y);
}
}
main()
{
}
答案 0 :(得分:1)
这个明显的编译器错误已经报告给NVIDIA编译器团队