帕斯卡上的cmem与纹理的表现

时间:2017-09-13 00:28:22

标签: cuda gpu-constant-memory

问题01:

如果线程中的数据请求频率非常高(每个线程从特定列中选择至少一个数据),那么在常量内存中使用数据存储是否会提供Pascal架构中的纹理优势?

问题02:

如果warp中的每个线程请求来自常量内存的相同指令数据,但是每个线程都从不同的地址请求它(没有广播),性能会比纹理内存差吗?

问题03:

常量内存和纹理的缓存是否具有相同的性能?它们都有相似的尺寸吗?我可以在Pascal架构上操作常量或纹理的缓存维度吗?

背景

内核中有一部分肯定会从纹理存储器中的二维矩阵的特定列请求一些浮点数据,通常,每个线程请求存储在相邻单元格“下方”的数据来自上一个帖子。

如果大多数经线低于25%,则同一经线中的两个线程的频率请求相同的地址,但是在经线的不到10%中可以达到50%。

可以确定这个特定的列符合95%的情况下的cmem。

0 个答案:

没有答案