OpenACC中的固定内存(使用PGI编译器)

时间:2016-12-28 15:02:33

标签: cuda gpu openacc pgi pgi-accelerator

我有一个简单的CUDA代码,我将其翻译为OpenACC。我的所有内核都按预期进行了并行化,它们与我的CUDA内核具有相似的性能。但是,设备到主机的内存传输会影响我的性能。在我的CUDA代码中,我使用固定内存,性能要好得多。不幸的是,在OpenACC中,我不知道如何利用固定内存。我在文档中找不到任何内容。有人能为我提供一个简单的OpenACC示例,它使用固定内存吗?

PS:我正在使用PGI 16.10-0 64位编译器

1 个答案:

答案 0 :(得分:3)

使用"固定" "特斯拉"的子选项目标," -ta =特斯拉:固定"。请注意,您可以通过" -help -ta"查看所有可用的子选项。标志。