我试图在CUDA中找到常量内存与纹理内存与全局内存之间的差异。
我能够找到以下相关文章,但无法找到我的问题的答案
global vs shared memory in CUDA
Usage of global vs. constant memory in CUDA
一篇文章介绍了三者的性能影响: http://forum.beyond3d.com/showthread.php?t=52510
答案 0 :(得分:7)
恒定记忆:
这是存储常量和内核参数的地方
慢,但有缓存(8 kb)
常量内存针对广播进行了优化
纹理记忆:
针对2D空间访问模式优化的缓存
读取具有一些优点,如地址模式和插值,可以免费使用
全球记忆:
慢&未缓存的(1.0),缓存(2.0)
需要顺序&对齐的16字节读写快速(合并读/写)
来源:http://www.cvg.ethz.ch/teaching/2011spring/gpgpu/cuda_memory.pdf