应用错误收集

我是一个刚刚开始CUDA编程的人似乎有SP SM和CUDA架构的概念我试着运行样本源的deviceQuery.cpp我认为什么有效，SP SM开发他们的环境，
已经不知道哪个项目SP是否是SM中的任何项目

我认为项目“（14）多处理器，（8）CUDA核心/ MP”并且对SP和SM都是正确的，但我会纠正对以下内容的理解？

SM =多处理器= 14
  SP = CUDA核心/ MP = 8
  CUDA核心= 14 * 8 = 112

顺便说一句，deviceQuery.cpp的结果如下：。

CUDA设备查询（运行时API）版本（CUDART静态链接）


检测到1个CUDA功能设备

设备0：“GeForce GTS 240
     CUDA驱动程序版本/运行时版本5.5 / 5.5
     CUDA能力主要/次要版本号：1.1
     全局内存总量：1024 MBytes（1073741824字节）
     （14）多处理器，（8）CUDA核心/ MP：112 CUDA核心
     GPU时钟频率：1620 MHz（1.62 GHz）
     内存时钟速率：1100 Mhz
     内存总线宽度：256位
     最大纹理尺寸大小（x，y，z）1D =（8192），2D =（65536,32768），3
   D =（2048,2048,2048）
     最大分层1D纹理尺寸，（num）层1D =（8192），512层
     最大分层2D纹理尺寸，（num）层2D =（8192,8192），512层
     常量内存总量：65536字节
     每块共享内存总量：16384字节
     每个块可用的寄存器总数：8192
     翘曲尺寸：32
     每个多处理器的最大线程数：768
     每个块的最大线程数：512
     线程块的最大尺寸大小（x，y，z）:( 512,512,64）
     网格大小（x，y，z）的最大尺寸大小：（65535,65535,1）
     最大内存间距：2147483647字节
     纹理对齐：256字节
     并发副本和内核执行：是1个副本引擎      内核运行时限：是
     集成GPU共享主机内存：没有      支持主机页锁定内存映射：是
     Surfaces的对齐要求：是
     设备具有ECC支持：已禁用
     设备支持统一寻址（UVA）：否      设备PCI总线ID / PCI位置ID：9/0      计算模式：
        ＆LT;默认（多个主机线程可以使用:: cudaSetDevice（）和设备simu    ltaneously ）＆gt;

关于CUDA的架构（SM，SP）

1 个答案: