标签: for-loop parallel-processing nested openmp
我正在尝试使用OpenMP并行化两个嵌套for循环。我遇到的问题是串行执行时间低于并行执行时间,如230ms / 700ms。此外,一旦并行化(结果错误),程序就无法按预期工作。
for(i=0; i<5000; i++) for(j=0; i<5000; j++) A[B[i][j]] = A[B[i][j]] + 1;
我尝试并行化的一个方法是:
#pragma omp parallel for schedule(guided) collapse(2)
谢谢。