//In other words, this equilavent to cv::Mat1f mat(5,n)
//i.e. a matrix 5xn
std::vector<cv::Mat1f> mat(5,cv::Mat1f::zeros(1,n));
std::vector<float> indexes(m);
// fill indexes
// m >> nThreads (from hundreds to thousands)
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
预期结果是将每行的每个元素增加一。这是一个玩具示例,实际总和更为复杂。我尝试将其并行化:
#pragma omp declare reduction(vec_float_plus : std::vector<cv::Mat1f> : \
std::transform(omp_out.begin(), omp_out.end(), omp_in.begin(), omp_out.begin(), std::plus<cv::Mat1f>())) \
initializer(omp_priv=omp_orig);
#pragma omp parallel for reduction(vec_float_plus : mat)
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
但是这会失败,因为每行的每个元素都是随机初始化的。我该如何解决这个问题?
所以我发现问题与https://www.webkj.com/react-native/javascript-error-unhandled-promise-rejection-warning有关。所以我应该使用:
初始化mat
std::vector<cv::Mat1f> mat(5);
for(size_t i=0; i<mat.size(); i++)
mat[i] = cv::Mat1f::zeros(1,n);
但是这会产生omp_priv = omp_orig
的问题,因为它会考虑std::vector<cv::Mat1f> mat(5);
并且它的值是未定义的。我怎么解决这个问题?我想到的唯一解决方案是创建一个包装器结构,例如:
class vectMat{
public:
vectMat(size_t rows, size_t j){
for(size_t i=0; i<rows; i++)
mats.push_back(cv::Mat1f::zeros(1,j));
}
private:
std::vector<cv::Mat1f> mats;
};
但是,我应该实现什么才能使其与其余代码一起使用?
答案 0 :(得分:1)
使用引用而不是复制的cv::Mat1f
等类型在这种情况下确实很危险。您可以通过拆分parallel
区域和for
循环来制作明确的解决方案。
#pragma omp declare reduction(vec_mat1f_plus : std::vector<cv::Mat1f> : \
std::transform(omp_out.begin(), omp_out.end(), omp_in.begin(), omp_out.begin(), std::plus<cv::Mat1f>()));
// initializer not necessary if you initialize explicitly
std::vector<cv::Mat1f> mat;
#pragma omp parallel reduction(vec_mat1f_plus : mat)
{
mat = std::vector<cv::Mat1f>(5);
for (auto& elem : mat) {
elem = cv:Mat1f::zeros(1, n);
}
#pragma omp for
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
}
我没有测试std::plus<cv::Mat1f>
是否有效,但是looks good。
如果您提供vectMat
深层复制基础operator=
和Mat
,并保留初始值设定项,那么clone()
的方法也会有效。