配置OpenACC和CPU代码

时间:2017-09-23 21:30:34

标签: profiling openacc pgi

我正在尝试一些针对GPU的OpenACC代码。

在我的实验中,我在GPU上运行代码的一些部分,在CPU上运行其他代码。

//Loop that seems to run well on a GPU
#pragma acc parallel loop
for(int i=0;i<1000;i++)
...

//Loop that, for whatever reason, might run better on a CPU
for(int i=0;i<1000;i++)
...

问题是推断这对性能的影响。使用PGI_ACC_TIME,我可以获得有关GPU在GPU上占用多长时间的信息,但目前尚不清楚如何将其与CPU信息交错。

有没有办法交错来自CPU和GPU的时序信息?命令行实用程序是可取的,因为我的大多数会话都是远程的,但使用GUI的方法可能没问题。

0 个答案:

没有答案