我正在使用parallel_reduce并行构建直方图:
#include "stdint.h"
#include "tbb/tbb.h"
#include <algorithm>
#include <vector>
#include <functional>
#include <iostream>
#include <numeric>
void buildhistogram(const uint8_t *inputImage, const size_t numElements, double *outputHist){
auto range = tbb::blocked_range<size_t>(0,numElements);
auto buildHistogramFcn = [&](const tbb::blocked_range<size_t>& r, const std::vector<double>& initHist){
std::vector<double> localHist(initHist);
for (size_t idx = r.begin(); idx != r.end(); ++idx){
localHist[inputImage[idx]]++;
}
return localHist;
};
auto reductionFcn = [&](const std::vector<double>& hist1, const std::vector<double>& hist2){
std::vector<double> histOut(hist1.size());
std::transform(hist1.begin(),hist1.end(),hist2.begin(),histOut.begin(),std::plus<double>());
return histOut;
};
std::vector<double> identity(256);
auto output = tbb::parallel_reduce(range, identity, buildHistogramFcn, reductionFcn);
std::copy(output.begin(),output.end(),outputHist);
}
我的问题是关于lambda形式的parallel_reduce中Func的定义。如果您查看英特尔文档:
https://software.intel.com/en-us/node/506154
他们将Func的第二个RHS参数记录为const:
Value Func::operator()(const Range& range, const Value& x)
但是,如果你看看他们的示例代码,他们定义了第二个RHS是非const的例子,实际上他们修改并返回这个变量:
auto intelExampleFcn = [](const blocked_range<float*>& r, float init)->float {
for( float* a=r.begin(); a!=r.end(); ++a )
init += *a;
return init;
};
如果我尝试声明变量&#34; initHist&#34;作为非const并且直接使用此内存而不分配和返回本地副本:
auto buildHistogramFcn = [&](const tbb::blocked_range<size_t>& r, std::vector<double>& initHist){
for (size_t idx = r.begin(); idx != r.end(); ++idx){
initHist[inputImage[idx]]++;
}
return initHist;
};
我收到编译错误:
/tbb/include/tbb/parallel_reduce.h:322:24:错误:没有匹配函数来调用类型&#39; const的对象(lambda at buildhistogramTBB.cpp:16:30)&# 39; my_value = my_real_body(range,const_cast(my_value));
我对lambda的第二个RHS参数是否实际上可以是非const感兴趣,因为我希望能够避免将矢量的副本从init参数复制到本地我回来的变量。
我误解了某些内容,还是英特尔的例子不正确?
答案 0 :(得分:1)
第二个&#34;非常数&#34;英特尔的例子中的论点正在被价值所传递。如果您按值传递initHist
向量(而不是按引用传递),则也不需要const
。 (当然,它会复制矢量。但这似乎就是你正在做的事情。)