标签: openmp openacc
我有一个主要使用OpenACC开发的代码,我想将使用OpenACC的P100结果与使用OpenMP的英特尔KNL节点进行比较,我尝试使用编译器标志-ta = multi_core,但它基本上序列化了所有循环(按照-acc信息)。是对所有循环使用预处理器指令的唯一方法吗?还有其他更有效或更清洁的方法吗?
#ifndef _OPENACC #pragma omp ..... #else #pragma acc ...... #endif