我使用OpenMP来并行化我的代码。我尝试用两个迭代器并行化一个循环。我想知道我的实现是否是并行化这个顺序代码的最佳方法:
#include <iostream>
#include <vector>
#include <omp.h>
using namespace std;
int main(int argc, char *argv[])
{
vector<float> v = {1, 2, 3, 4};
vector<float> d = {0, 0, 0, 0};
vector<float>::iterator iterV, iterD;
for(iterV = v.begin(), iterD = d.begin(); iterV < v.end(); ++iterV, ++iterD)
{
*iterD = *iterV;
}
for(iterD = d.begin(); iterD < d.end(); ++iterD)
cout << *iterD << endl;
return 0;
}
此代码的并行版本:
#include <iostream>
#include <vector>
#include <omp.h>
using namespace std;
int main(int argc, char *argv[])
{
vector<float> v = {1, 2, 3, 4};
vector<float> d = {0, 0, 0, 0};
vector<float>::iterator iterV, iterD;
iterV = v.begin();
iterD = d.begin();
#pragma omp parallel for
for(int i = 0; i < v.size(); ++i)
{
*(iterD + i) = *(iterV + i) ;
}
for(iterD = d.begin(); iterD < d.end(); ++iterD)
cout << *iterD << endl;
return 0;
}`
答案 0 :(得分:0)
您的示例非常简单,几乎不需要任何性能优化。您只需复制内存(可以使用std::copy
进行优化)。
您编写的代码是正确的,几乎没有其他方法可以编写代码来获得性能。但是,为了维护更清晰的代码,我尝试将循环迭代器保持为每个线程的私有。这使代码干净(个人偏好)。
vector<float> v = {1, 2, 3, 4};
vector<float> d = {0, 0, 0, 0};
#pragma omp parallel for
for(auto it_v = v.begin(),it_d = d.begin(); it_v!=v.end();++it_v,++it_d)
{
*it_d = *it_v;
}
修改强>
在这种情况下,OpenMP 3.1不允许多循环初始化。它不符合他们的规范。所以一种方法是:
#pragma omp parallel
{
auto it_v = v.begin(),it_d = d.begin();
#pragma openmp for
for(; it_v!=v.end();++it_v)
{
*it_d = *it_v;
}
}