检测CPU和线程的OpenMP行为

时间:2011-12-03 07:32:47

标签: multithreading

我刚刚开始使用OpenMP,我只是用gcc -fopenmp openmp_c_helloworld.c编译了以下代码:

#include <omp.h>
#include <stdio.h>
#include <stdlib.h>

int main (int argc, char *argv[]) {
  int th_id, nthreads;
  #pragma omp parallel private(th_id)
  {
    th_id = omp_get_thread_num();
    printf("Hello World from thread %d\n", th_id);
    #pragma omp barrier
    if ( th_id == 0 ) {
      nthreads = omp_get_num_threads();
      printf("There are %d threads\n",nthreads);
    }
  }
  return EXIT_SUCCESS;
}

我只是在具有HyperThreading的四核Intel CPU上运行可执行文件,我获得了以下输出:

Hello World from thread 2
Hello World from thread 0
Hello World from thread 3
Hello World from thread 1
There are 4 threads

从技术上讲,我的CPU上有8个线程和4个CPU内核,为什么OpenMP只显示4个线程?

1 个答案:

答案 0 :(得分:1)

简而言之,我认为这是因为OpenMP会查找CPU(核心)的数量而不是处理器线程的数量。 见this页面:`

  

实现默认值 - 通常是节点上的CPU数量   它可能是动态的(见下一个子弹)。

您可以尝试的是将程序中的线程数设置为等于处理器线程数,并查看是否有性能改进(您必须创建自己的基准测试程序)。 在并行编程中,当工作线程的数量等于处理器线程的数量时,获得了良好的性能。您也可以为I / O保留一两个额外的线程。