为什么nvidia控制面板和设备查询之间的cuda核心差异?

时间:2015-11-24 08:38:05

标签: cuda gpu nvidia

Q1:为什么我从Nvidia控制面板获得了不同的信息 - >来自cuda sdk中设备查询示例的系统信息和信息。

系统信息:

  • cuda核心384核心
  • 内存数据速率1800MHz

Nvidia Control Panel

设备查询输出:

  • cuda cores = 2 MP x 192 SP / MP = 576 cuda cores
  • 内存时钟频率900MHz

Device Query output

Q2:如何使用设备查询数据计算GPU的GFLOP? 我找到的最常用的公式是提到的here,建议使用多个单位数,我不知道的多单位数?

最大GFLOPS(核心x SIMDs x([mul-add] x2 + [mul] * 1)*时钟速度)

1 个答案:

答案 0 :(得分:1)

Q1:它告诉你就在线上......

  

适用于SM 5.0的MapSMtoCores不受限制。默认使用192 Cores / SM

Maxwell,GeForce 840M背后的架构,使用128"内核"每个" SMM"

3 * 128 = 384

Q2:"Cores" * frequency * 2(因为每个核心可以进行乘法+加法)