如何对CUDA向量类型的数组进行排序

时间:2015-10-08 23:01:37

标签: sorting cuda thrust cub

具体来说,我如何对float3数组进行排序?这样.x组件是主要排序条件,.y组件是次要排序标准,.z组件是第三类排序标准。

是否有一个简单的解决方案可以拨打cub:: DeviceRadixSortthrust::sort_by_key

目前我想也许我可以创建一个uint32键数组,其中每个元素的前三分之一数字取自输入数组的.x组件的前三分之一,第二个从输入数组的.y组件的前三分之一中取得的第三个数字,以及从输入数组的.z组件的前三分之一中取得的最后三分之一数字。或者有更好的解决方案吗?

1 个答案:

答案 0 :(得分:2)

使用example提出的Robert Crovella我制定了以下解决方案。再次感谢Rob。

#include <thrust/sort.h>
#include <thrust/device_ptr.h>

struct sort_float3 {
    __host__ __device__
    bool operator()(const float3 &a, const float3 &b) const {

    if      (a.x <= b.x && a.y <= b.y && a.z < b.z) return true;
    else if (a.x <= b.x && a.y < b.y) return true;
    else if (a.x < b.x) return true;
    else return false;
    }
};

int main(void)
{
    float3 *h_array;
    // Define your host array
    float3 *d_array;
    cudaMallocHost( (void**)&d_array,
                    number_of_elements * sizeof(float3) );      
    cudaMemcpy( d_array,
                h_array, 
                number_of_elements * sizeof(float3),
                cudaMemcpyHostToDevice );

    thrust::device_ptr<float3> th_array( d_array );
    thrust::sort( th_array, 
                  th_array+number_of_elements , 
                  sort_float3() );
    return 0;
}