我正在执行以下代码片段,如openMP教程中所述。但我所看到的是执行时间并没有随着NUM_THREADS而改变,事实上,执行的时间只是不断改变很多......我想知道我试图测量时间的方式是错误的。我尝试使用clock_gettime,但我看到了相同的结果。请任何人帮忙。不仅仅是使用openMP减少时间的问题,我很困难为什么报告的时间变化很大。
#include "iostream"
#include "omp.h"
#include "stdio.h"
double getTimeNow();
static long num_steps = 10000000;
#define PAD 8
#define NUM_THREADS 1
int main ()
{
int i,nthreads;
double pi, sum[NUM_THREADS][PAD];
double t0,t1;
double step = 1.0/(double) num_steps;
t0 = omp_get_wtime();
#pragma omp_set_num_threads(NUM_THREADS);
#pragma omp parallel
{
int i, id,nthrds;
double x;
id = omp_get_thread_num();
nthrds = omp_get_num_threads();
if(id==0) nthreads = nthrds;
for (i=id,sum[id][0]=0;i< num_steps; i=i+nthrds)
{
x = (i+0.5)*step;
sum[id][0] += 4.0/(1.0+x*x);
}
}
for(i=0, pi=0.0;i<nthreads;i++)pi += sum[i][0] * step;
t1 = omp_get_wtime();
printf("\n value obtained is %f\n",pi);
std::cout << "It took "
<< t1-t0
<< " seconds\n";
return 0;
}
答案 0 :(得分:0)
您使用openmp_set_num_threads()
,但它是一个函数,而不是编译器指令。您应该在没有#pragma
的情况下使用它:
openmp_set_num_threads(NUM_THREADS);
此外,您可以在编译器指令中设置线程数,但关键字不同:
#pragma omp parallel num_threads(4)
首选方法是不对程序中的线程数进行硬编码,而是使用环境变量OMP_NUM_THREADS。例如,在bash中:
export OMP_NUM_THREADS=4
但是,最后一个示例不适合您的程序。