是否可以像Thrust这样在CUB中使用迭代器? 我不想按如下方式使用CUB代替推力:
__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
float resultat = 0;
int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
float tmp;
i--;
while (resultat != -1 && i != 0)
{
if (resultat > SEUIL_ROSTER)
{
resultat = -1;
}
else
{
tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
resultat = resultat + tmp;
i--;
}
}
因为CUB比信任快,所以我试图用它来减少数组的段数。
答案 0 :(得分:1)
否。
此外,不可能使用CUB来执行与代码中所示相同的操作。根据编译内核的方式,推力将发出代码,其中每个线程以串行方式执行减少操作,或者使用动态并行性通过子内核启动来执行代码。另一方面,CUB具有扭曲和块范围设备缩减功能。它不支持单线程或动态并行作用域操作。