我可以使用CUDA CUB迭代器代替推力吗?

时间:2018-10-09 20:42:32

标签: cuda gpgpu thrust cub

是否可以像Thrust这样在CUB中使用迭代器? 我不想按如下方式使用CUB代替推力:

__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
    int tid = blockIdx.x * blockDim.x + threadIdx.x;
    float resultat = 0;

    int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
    resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);


    float tmp;
    i--;

    while (resultat != -1 && i != 0)
    {
        if (resultat > SEUIL_ROSTER)
        {
            resultat = -1; 
        }
        else
        {               

            tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);

            resultat = resultat + tmp;


            i--;
        }
    }

因为CUB比信任快,所以我试图用它来减少数组的段数。

1 个答案:

答案 0 :(得分:1)

否。

此外,不可能使用CUB来执行与代码中所示相同的操作。根据编译内核的方式,推力将发出代码,其中每个线程以串行方式执行减少操作,或者使用动态并行性通过子内核启动来执行代码。另一方面,CUB具有扭曲和块范围设备缩减功能。它不支持单线程或动态并行作用域操作。