Thrust:reduce_by_key将zip_iterator(元组)传递给自定义仿函数以按键检索平均值

时间:2016-06-17 21:50:17

标签: c++ cuda gpgpu thrust

我要做的是通过thrust::reduce_by_key按键获得平均值。我首先sort_by_key,可以按reduce_by_key的连续键进行分组。我使用this来帮助我这么做。但是,我收到很多我无法理解的错误(这也是我第一次使用reduce_by_key)而且我想不出更好的方法来做这个而不使用大量的临时分配来(1)获得总和按键计数,然后按键计数;(2)将两者除以平均值。

input keys:   1,   1,   1,  2,   3,   5,  5,  2
input values: 120, 477, 42, 106, 143, 53, 83, 24

expected output values: 213, 65, 143, 68

我有以下自定义函数:

struct GetAverage
{
    template<typename Tuple>
    __host__ __device__
    int operator()(const Tuple& t)
    {
        //SumByKey / CountByKey
        return thrust::get<0>(t) / thrust::get<1>(t);
    }
};

从下面的代码中调用仿函数,该代码位于main()

thrust::device_vector<unsigned int> tempKey(8);
thrust::device_vector<unsigned int> tempValue(8);

tempKey[0] = 1;
tempKey[1] = 1;
tempKey[2] = 1;
tempKey[3] = 2;
tempKey[4] = 3;
tempKey[5] = 5;
tempKey[6] = 5;
tempKey[7] = 2;

tempValue[0] = 120;
tempValue[1] = 477;
tempValue[2] = 42;
tempValue[3] = 106;
tempValue[4] = 143;
tempValue[5] = 53;
tempValue[6] = 83;
tempValue[7] = 24;

thrust::sort_by_key(tempKey.begin(), tempKey.end(), tempValue.begin());

thrust::equal_to<int> binary_pred;
thrust::reduce_by_key(
    tempKey.begin(),
    tempKey.end(),
    thrust::make_zip_iterator(
        thrust::make_tuple(
            tempValue.begin(),
            thrust::make_constant_iterator(1)
        )
    ), //values_first; Should go into GetAverage() custom functor as a zipped tuple <tempValue, 1>
    tempKey.begin(), //keys_output; Should be returning the unique keys
    tempValue.begin(), //values_output; Should be returning the average by key 
    binary_pred,
    GetAverage()
);

示例错误:
- no instance of function template "GetAverage::operator()" matches the argument list
- no operator "=" matches these operands
- no suitable conversion function from "InputValueType" to "TemporaryType" exists
- no suitable conversion function from "thrust::detail::tuple_of_iterator_references<thrust::device_reference<int>, int, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type>" to "TemporaryType" exists

有没有人对如何解决这个问题有任何想法?还是链接?我在这里阅读了有关所用内容的文档,并尽可能小心地尝试理解它,但没有解决方案。谢谢!

更新
见Eric的回答。结合他所说的,这是新的源代码。为元组创建了一个op来处理加号。这段代码唯一没有做的是在reduce_by_key调用之后,应该在结果上使用thrust::transform以通过将总和除以计数来获得平均值。

// --- Defining key tuple type
typedef thrust::tuple<int, int> Tuple;

/* PLUS OPERATOR BETWEEN TUPLES */
struct TuplePlus
{
    __host__ __device__
    Tuple operator ()(const Tuple& lhs, const Tuple& rhs)
    {
        return thrust::make_tuple(
            thrust::get<0>(lhs) + thrust::get<0>(rhs),
            thrust::get<1>(lhs) + thrust::get<1>(rhs)
        );
    }
};

内部main()我现在有以下内容。

thrust::equal_to<int> binary_pred;
thrust::reduce_by_key(
    tempKey.begin(),
    tempKey.end(),
    thrust::make_zip_iterator(
        thrust::make_tuple(
            tempValue.begin(),
            thrust::make_constant_iterator(1)
        )
    ), //values_first; goes in as a zipped up tuple <value, 1>
    tempKey.begin(), //keys_output
    thrust::make_zip_iterator(
        thrust::make_tuple(
            tempValue.begin(),
            tempCount.begin()
        )
    ), //values_output; ZipIterator<Sum, Count> by key
    binary_pred,
    TuplePlus()
);

1 个答案:

答案 0 :(得分:1)

有两个问题。

元组序列减少的结果应该是一个元组,而不是int。根据文件

https://thrust.github.io/doc/group__reductions.html#ga633d78d4cb2650624ec354c9abd0c97f

最后一个参数binary_op应该是

类型
  

BinaryFunction是二元函数的模型,BinaryFunction的result_type可以转换为OutputIterator2的value_type。

这意味着你的减少操作应该是

struct GetSum
{
  template<typename Tuple>
  __host__ __device__
  Tuple operator()(const Tuple& a, construction Tuple& b)
  {
    ...
  }
}

另一方面,在缩小阶段,您只能有效地计算总和而不是平均值。这意味着您的values_output也应该是与values_first具有相同类型的zip迭代器。

  

OutputIterator2是Output Iterator的模型,InputIterator2的value_type可以转换为OutputIterator2的value_type。

因此,您需要两个结果数组,一个用于按键求和,另一个用于按键计数。它们应该压缩在一起并用作values_output

然后您需要另一个thrust::transform来计算最终结果 - 按键平均值。

您还可以尝试使用@RobertCrovella提出的方法,该方法使用单个thrust::reduce_by_key来计算平均值。

Output from reduce_by_key() as a function of two reduced vectors