据我所知,Fermi GPU支持预取L1或L2缓存。但是,在CUDA参考手册中我找不到任何关于它的东西。
Dues CUDA允许我的内核代码预取特定数据到特定级别的缓存吗?
答案 0 :(得分:5)
不是在指令级别,而是有关在此处预取GPU的详细信息:
Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(2010年微观架构ACM研讨会上的论文)
您可以在nVIDIA的PTX ISA reference文档中找到说明参考;相关说明为prefetch
and prefetchu
。