我刚刚开始使用OpenMP,我只是用gcc -fopenmp openmp_c_helloworld.c
编译了以下代码:
#include <omp.h>
#include <stdio.h>
#include <stdlib.h>
int main (int argc, char *argv[]) {
int th_id, nthreads;
#pragma omp parallel private(th_id)
{
th_id = omp_get_thread_num();
printf("Hello World from thread %d\n", th_id);
#pragma omp barrier
if ( th_id == 0 ) {
nthreads = omp_get_num_threads();
printf("There are %d threads\n",nthreads);
}
}
return EXIT_SUCCESS;
}
我只是在具有HyperThreading的四核Intel CPU上运行可执行文件,我获得了以下输出:
Hello World from thread 2
Hello World from thread 0
Hello World from thread 3
Hello World from thread 1
There are 4 threads
从技术上讲,我的CPU上有8个线程和4个CPU内核,为什么OpenMP只显示4个线程?
答案 0 :(得分:1)
简而言之,我认为这是因为OpenMP会查找CPU(核心)的数量而不是处理器线程的数量。 见this页面:`
实现默认值 - 通常是节点上的CPU数量 它可能是动态的(见下一个子弹)。
您可以尝试的是将程序中的线程数设置为等于处理器线程数,并查看是否有性能改进(您必须创建自己的基准测试程序)。 在并行编程中,当工作线程的数量等于处理器线程的数量时,获得了良好的性能。您也可以为I / O保留一两个额外的线程。