标签: c++ cuda gpgpu thrust cub
以下是推力代码:
h_in_value[7] = thrust::reduce(thrust::device, d_in1 + a - b, d_ori_rho_L1 + a);
这里,thrust::reduce采用第一个和最后一个输入迭代器,而推力将值返回给CPU(复制到h_in_value)
thrust::reduce
可以使用CUB获取此功能吗?