Question

我想与openMP并行化一个对框进行采样的函数（在框中随机选择点，并在这些点评估给定函数）。我写了以下代码。

//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
    points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(lower,upper);
    for(int k=0;k<ndim;k++)
    {
        points_[i][k]=pt_[k];
    }
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

但是，我对此代码没有信心：evals_和points_在eauch线程中更新。我想在那里添加一些原子语句：

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(m_lower,m_upper);
    for(int k=0;k<m_ndim;k++)
    {
        #pragma omp atomic update
        points_[i][k]=pt_[k];
    }
    #pragma omp atomic update
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

但我担心这会非常低效：你有什么建议可以更准确地写出来吗？并且...这不是编译...（错误：#pragma omp atomic表示不正确的表达式）虽然我可以在openMP规范中找到该检查，A22

void atomic_example(float *x, float *y, int *index, int n)
{
    int i;
    #pragma omp parallel for shared(x, y, index, n)
    for (i=0; i<n; i++) {
    #pragma omp atomic update
    x[index[i]] += work1(i);
    y[i] += work2(i);
    }
}

并且原子更新也遵循对数组的影响。

谢谢和问候。

EDIT --------

我同意都铎的回答。但是，似乎这个例子在另一个并行化的代码片段中确实需要原子：on line sum _ + = ...，发生错误（并发访问）

for(i=0;i<m_ndim;i++)
{
    double sum_=0;
    #pragma omp parallel reduction(+:sum_)
    for(j=0;j<m_npts;j++)
    {
        sum_ += set_[j][i];
    }
    Sum_[i] = sum_;
}

为什么需要呢？还是别的错了？

Answer 1

您的代码中不需要任何原子句。

原因是外部循环被分割为索引i，因此每个线程将从points_和eval_获得一组不与另一个重叠的元素线程的工作集。

evals_是一个数组，因此每个线程将获得一个连续的子数组（由于隐式静态调度方案），例如。

0 1 2 3 . 4 5 6 7 . 8 9 10 11...
   t1        t2        t3

points_是一个二维矩阵，每个线程都会得到一组连续的行：

在第二种情况下，您似乎在k的值上有重叠，因为每个线程的k范围相同，但更新的点落在不同的行上（索引） i），如上所示，对于不同的线程不重叠。

openMP - 对变量和原子的并发访问

1 个答案: