我想使用openmp reduction操作符添加循环所有的迭代。
这是我的代码:
#include <omp.h>
#include <stdio.h>
#include <stdlib.h>
#define CHUNKSIZE 2
#define N 100
int main (int argc, char *argv[])
{
int nthreads, tid, i, chunk;
float a[N], b[N], c[N];
/* Some initializations */
for (i=0; i < N; i++)
a[i] = b[i] = i * 1.0;
chunk = CHUNKSIZE;
int x=0;
#pragma omp parallel shared(a,b,c,nthreads,chunk) private(i,tid) reduction(+ : x)
{
tid = omp_get_thread_num();
if (tid == 0)
{
nthreads = omp_get_num_threads();
printf("Number of threads = %d\n", nthreads);
}
printf("Thread %d starting...\n",tid);
#pragma omp for schedule(static,chunk)
for (i=0; i<N; i++)
{
c[i] = a[i] + b[i];
printf("Thread %d: c[%d]= %f\n",tid,i,c[i]);
x++;
}
} /* end of parallel section */
printf("Value of x is %d" , x);
}
问题是x的最终值是100,而不是200.我无法理解为什么我没有得到200的预期值。有人可以帮助我吗?
答案 0 :(得分:2)
100 预期结果:
#pragma omp for schedule(static,chunk)
for (i=0; i<N; i++) {
...
}
每个线程将从[0..N[
间隔获取一组双元素块,并且仅为其分配的值增加x
。因此,在所有主题中执行x++
的总次数为N
。
即。假设有三个线程,一个将运行i=0,1,6,7,12,13,...
的循环体,i=2,3,8,9,...
的第二个线程和i=4,5,10,11,...
的第三个线程。