我可以将特定数据预取到CUDA内核中的特定缓存级别吗?

时间:2011-01-21 04:08:30

标签: caching cuda gpgpu prefetch ptx

据我所知,Fermi GPU支持预取L1或L2缓存。但是,在CUDA参考手册中我找不到任何关于它的东西。

Dues CUDA允许我的内核代码预取特定数据到特定级别的缓存吗?

1 个答案:

答案 0 :(得分:5)

不是在指令级别,而是有关在此处预取GPU的详细信息:

Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(2010年微观架构ACM研讨会上的论文)

您可以在nVIDIA的PTX ISA reference文档中找到说明参考;相关说明为prefetch and prefetchu