循环for iterator openMP

时间:2016-05-05 14:29:27

标签: c++ loops iterator openmp

我使用OpenMP来并行化我的代码。我尝试用两个迭代器并行化一个循环。我想知道我的实现是否是并行化这个顺序代码的最佳方法:

#include <iostream>
#include <vector>
#include <omp.h>

using namespace std;

int main(int argc, char *argv[])
{
  vector<float> v = {1, 2, 3, 4};
  vector<float> d = {0, 0, 0, 0};   
  vector<float>::iterator iterV, iterD; 

  for(iterV = v.begin(), iterD = d.begin(); iterV < v.end(); ++iterV, ++iterD)
    {
      *iterD =  *iterV; 
    }


  for(iterD = d.begin(); iterD < d.end(); ++iterD)
    cout << *iterD << endl;  

  return 0;
}

此代码的并行版本:

#include <iostream>
#include <vector>
#include <omp.h>

using namespace std;

int main(int argc, char *argv[])
{
  vector<float> v = {1, 2, 3, 4};
  vector<float> d = {0, 0, 0, 0};   
  vector<float>::iterator iterV, iterD; 

  iterV = v.begin();
  iterD = d.begin();

 #pragma omp parallel for
  for(int i = 0; i < v.size(); ++i)
    {
      *(iterD + i) =  *(iterV + i) ; 
    }


  for(iterD = d.begin(); iterD < d.end(); ++iterD)
    cout << *iterD << endl;  

  return 0;
}`

1 个答案:

答案 0 :(得分:0)

您的示例非常简单,几乎不需要任何性能优化。您只需复制内存(可以使用std::copy进行优化)。

您编写的代码是正确的,几乎没有其他方法可以编写代码来获得性能。但是,为了维护更清晰的代码,我尝试将循环迭代器保持为每个线程的私有。这使代码干净(个人偏好)。

  vector<float> v = {1, 2, 3, 4};
  vector<float> d = {0, 0, 0, 0};   
  #pragma omp parallel for
  for(auto it_v = v.begin(),it_d = d.begin(); it_v!=v.end();++it_v,++it_d)
    {
      *it_d =  *it_v; 
    }

修改

在这种情况下,OpenMP 3.1不允许多循环初始化。它不符合他们的规范。所以一种方法是:

  #pragma omp parallel
  {
    auto it_v = v.begin(),it_d = d.begin();
    #pragma openmp for
    for(; it_v!=v.end();++it_v)
    {
      *it_d =  *it_v; 
    }
  }