标签: caching memory cuda
我正在分析占用率对CFD应用程序GPU加速求解器性能的影响。当我增加解决该域所涉及的线程数时,L2缓存命中率显着降低(从70%降至25%)。为什么会这样?
线程请求的数据之间的距离很大,我想这是问题的原因。