标签: caching gpu
我正在谷歌上搜索this paper来衡量图形处理单元缓存的各种数据。该论文具有读取延迟与阵列大小图形,看起来像步进函数。
显然,从这张图中,我们可以看出缓存大小是2048B(步骤开始的地方),行大小是单步的宽度,以及"方式大小" (无论是什么)是整个步骤(2560B - 2048B)的宽度。
这非常简洁,可以方便地确定缓存的结构,我不相信它通常是针对GPU记录的。但是,我想知道这些解释源于何处。他们背后的理由/逻辑是什么?