关于CUDA的架构(SM,SP)

时间:2013-10-17 10:05:49

标签: c++ c visual-studio cuda gpgpu

我是一个刚刚开始CUDA编程的人 似乎有SP SM和CUDA架构的概念 我试着运行样本源的deviceQuery.cpp我认为什么有效,SP SM开发他们的环境,
已经不知道哪个项目SP是否是SM中的任何项目

我认为项目“(14)多处理器,(8)CUDA核心/ MP”并且对SP和SM都是正确的,但我会纠正对以下内容的理解?

  

SM =多处理器= 14
  SP = CUDA核心/ MP = 8
  CUDA核心= 14 * 8 = 112

顺便说一句,deviceQuery.cpp的结果如下:。

  

CUDA设备查询(运行时API)版本(CUDART静态链接)

     

检测到1个CUDA功能设备

     

设备0:“GeForce GTS 240
     CUDA驱动程序版本/运行时版本5.5 / 5.5
     CUDA能力主要/次要版本号:1.1
     全局内存总量:1024 MBytes(1073741824字节)
     (14)多处理器,(8)CUDA核心/ MP:112 CUDA核心
     GPU时钟频率:1620 MHz(1.62 GHz)
     内存时钟速率:1100 Mhz
     内存总线宽度:256位
     最大纹理尺寸大小(x,y,z)1D =(8192),2D =(65536,32768),3
   D =(2048,2048,2048)
     最大分层1D纹理尺寸,(num)层1D =(8192),512层
     最大分层2D纹理尺寸,(num)层2D =(8192,8192),512层
     常量内存总量:65536字节
     每块共享内存总量:16384字节
     每个块可用的寄存器总数:8192
     翘曲尺寸:32
     每个多处理器的最大线程数:768
     每个块的最大线程数:512
     线程块的最大尺寸大小(x,y,z):( 512,512,64)
     网格大小(x,y,z)的最大尺寸大小:(65535,65535,1)
     最大内存间距:2147483647字节
     纹理对齐:256字节
     并发副本和内核执行:是1个副本引擎      内核运行时限:是
     集成GPU共享主机内存:没有      支持主机页锁定内存映射:是
     Surfaces的对齐要求:是
     设备具有ECC支持:已禁用
     设备支持统一寻址(UVA):否      设备PCI总线ID / PCI位置ID:9/0      计算模式:
        <默认(多个主机线程可以使用:: cudaSetDevice()和设备simu    ltaneously )>

1 个答案:

答案 0 :(得分:6)

根据this,你是对的:

SM =流式多处理器

SP =流媒体处理器= CUDA核心

总SP / CUDA核心数量= SM数量*每个SM的SP / CUDA核心数量