我是Cuda C编程的新手,我陷入了一个问题,即我需要将一个块的所有线程的值添加到单个变量中。我正在启动5个块,每个块包含6个线程,并且需要将一个块的所有线程的值添加到单个变量中。顺序代码如下所示:
我尝试了一些使用共享内存的示例,但没有成功
int arr[6]={11,12,13,14,15,16};
int sum[5];
for(int j=0;j<5;j++)
{
for (int i=0 ; i<6 ; i++)
{
sum[j]+=arr[i];
}
}