与用于内存交易的NVIDIA GPU性能计数器相关的子分区,扇区和DRAM单元是什么?
我正在寻找有关如何解释以下性能计数器的信息:
fb_subp0_read_sectors:发送到子分区的读取请求数 所有DRAM单元中的0个fb_subp1_read_sectors:读取的数量 请求发送到所有DRAM单元的子分区1 fb_subp0_write_sectors:发送到的写入请求数 所有DRAM单元的子分区0 fb_subp1_write_sectors:Number 发送到所有DRAM单元的子分区1的读请求 fb0_subp0_read_sectors:发送到的读取请求数 DRAM单元0的子分区0 fb0_subp1_read_sectors:数量 读取发送到DRAM单元0的子分区1的请求 fb0_subp0_write_sectors:发送到的写入请求数 DRAM单元0的子分区0 fb0_subp1_write_sectors:Number of 写入发送到DRAM单元0的子分区1的请求 fb1_subp0_read_sectors:发送到的读取请求数 DRAM单元1的子分区0 fb1_subp1_read_sectors:Number of 读取发送到DRAM单元1的子分区1的请求 fb1_subp0_write_sectors:发送到的写入请求数 DRAM单元1的子分区0 fb1_subp1_write_sectors:Number 写请求发送到DRAM单元1的子分区1
我检查了NVIDIA Visual Profiler 5.0的文档,但没有找到任何其他信息。
答案 0 :(得分:4)
对于大多数gpus,您将看到以下四个计数器: fb_subp0_read_sectors:发送到所有DRAM单元的子分区0的读取请求数 fb_subp1_read_sectors:发送到所有DRAM单元的子分区1的读取请求数 fb_subp0_write_sectors:发送到所有DRAM单元的子分区0的写请求数 fb_subp1_write_sectors:发送到所有DRAM单元的子分区1的读取请求数
DRAM被分成多个单元(分区),每个单元被分成最多2个子分区。当您分析fb_subp0_read_sectors或fb_subp0_write_sectors计数器时,您将从所有单元获得subparition 0的聚合值。类似地,当您分析fb_subp1_read_sectors或fb_subp1_write_sectors时,您将从所有DRAM单元获得子分区1的聚合值。 扇区是访问DRAM内存的单位,它是32字节。
其他计数器仅适用于费米家族的一些gpus(GeForce GT 440/430/420和GeForce GT 520/530,GeForce GT 610)。由于某些硬件限制,它们被引入。