在NVIDIA GPU分析中,什么是子分区,扇区和单元?

时间:2014-01-15 01:52:55

标签: cuda profiling gpu nvidia

与用于内存交易的NVIDIA GPU性能计数器相关的子分区,扇区和DRAM单元是什么?

我正在寻找有关如何解释以下性能计数器的信息:

  

fb_subp0_read_sectors:发送到子分区的读取请求数   所有DRAM单元中的0个fb_subp1_read_sectors:读取的数量   请求发送到所有DRAM单元的子分区1   fb_subp0_write_sectors:发送到的写入请求数   所有DRAM单元的子分区0 fb_subp1_write_sectors:Number   发送到所有DRAM单元的子分区1的读请求   fb0_subp0_read_sectors:发送到的读取请求数   DRAM单元0的子分区0 fb0_subp1_read_sectors:数量   读取发送到DRAM单元0的子分区1的请求   fb0_subp0_write_sectors:发送到的写入请求数   DRAM单元0的子分区0 fb0_subp1_write_sectors:Number of   写入发送到DRAM单元0的子分区1的请求   fb1_subp0_read_sectors:发送到的读取请求数   DRAM单元1的子分区0 fb1_subp1_read_sectors:Number of   读取发送到DRAM单元1的子分区1的请求   fb1_subp0_write_sectors:发送到的写入请求数   DRAM单元1的子分区0 fb1_subp1_write_sectors:Number   写请求发送到DRAM单元1的子分区1

我检查了NVIDIA Visual Profiler 5.0的文档,但没有找到任何其他信息。

1 个答案:

答案 0 :(得分:4)

对于大多数gpus,您将看到以下四个计数器: fb_subp0_read_sectors:发送到所有DRAM单元的子分区0的读取请求数 fb_subp1_read_sectors:发送到所有DRAM单元的子分区1的读取请求数 fb_subp0_write_sectors:发送到所有DRAM单元的子分区0的写请求数 fb_subp1_write_sectors:发送到所有DRAM单元的子分区1的读取请求数

DRAM被分成多个单元(分区),每个单元被分成最多2个子分区。当您分析fb_subp0_read_sectors或fb_subp0_write_sectors计数器时,您将从所有单元获得subparition 0的聚合值。类似地,当您分析fb_subp1_read_sectors或fb_subp1_write_sectors时,您将从所有DRAM单元获得子分区1的聚合值。 扇区是访问DRAM内存的单位,它是32字节。

其他计数器仅适用于费米家族的一些gpus(GeForce GT 440/430/420和GeForce GT 520/530,GeForce GT 610)。由于某些硬件限制,它们被引入。