我有点困惑有多少标量香奈儿(我的意思是" gpu simd宽度" x" gpu simd core") GPU拥有,例如我自己的GPU" nvidia geforce gt 610")
它有48个着色器处理器(我每次跳过这样的处理器都有单独的SIMD 作为一个处理词),有人还说mosc common(?)gpu simd width是32 浮点数/整数 - 我的计算正确,它只有48x32 = 1536标量 渠道? (我的意思是当所有着色器处理器都在工作时,可以一步处理1536个浮点数)答案 0 :(得分:1)
GT610是一个cc 2.1 GPU,只有一个SM。该SM包含48个CUDA核心(=着色器处理器)。每个CUDA内核能够在每个时钟周期产生一个单精度标量结果。每个CUDA核心都没有单独的SIMD路径来处理SIMD字。它在每个时钟周期处理一个标量元素。
它有48个标量通道。可以在一个步骤中处理48个浮点数,即在一个时钟周期内处理。
GT610的SIMT矢量宽度为32,就像在所有CUDA GPU上一样 - 这是"扭曲尺寸"。这意味着当发出CUDA指令时,它将在每个指令问题的32个线程中执行。