我是一个刚刚开始CUDA编程的人
似乎有SP SM和CUDA架构的概念
我试着运行样本源的deviceQuery.cpp我认为什么有效,SP SM开发他们的环境,
已经不知道哪个项目SP是否是SM中的任何项目
我认为项目“(14)多处理器,(8)CUDA核心/ MP”并且对SP和SM都是正确的,但我会纠正对以下内容的理解?
SM =多处理器= 14
SP = CUDA核心/ MP = 8
CUDA核心= 14 * 8 = 112
顺便说一句,deviceQuery.cpp的结果如下:。
CUDA设备查询(运行时API)版本(CUDART静态链接)
检测到1个CUDA功能设备
设备0:“GeForce GTS 240
CUDA驱动程序版本/运行时版本5.5 / 5.5
CUDA能力主要/次要版本号:1.1
全局内存总量:1024 MBytes(1073741824字节)
(14)多处理器,(8)CUDA核心/ MP:112 CUDA核心
GPU时钟频率:1620 MHz(1.62 GHz)
内存时钟速率:1100 Mhz
内存总线宽度:256位
最大纹理尺寸大小(x,y,z)1D =(8192),2D =(65536,32768),3
D =(2048,2048,2048)
最大分层1D纹理尺寸,(num)层1D =(8192),512层
最大分层2D纹理尺寸,(num)层2D =(8192,8192),512层
常量内存总量:65536字节
每块共享内存总量:16384字节
每个块可用的寄存器总数:8192
翘曲尺寸:32
每个多处理器的最大线程数:768
每个块的最大线程数:512
线程块的最大尺寸大小(x,y,z):( 512,512,64)
网格大小(x,y,z)的最大尺寸大小:(65535,65535,1)
最大内存间距:2147483647字节
纹理对齐:256字节
并发副本和内核执行:是1个副本引擎 内核运行时限:是
集成GPU共享主机内存:没有 支持主机页锁定内存映射:是
Surfaces的对齐要求:是
设备具有ECC支持:已禁用
设备支持统一寻址(UVA):否 设备PCI总线ID / PCI位置ID:9/0 计算模式:
<默认(多个主机线程可以使用:: cudaSetDevice()和设备simu ltaneously )>
答案 0 :(得分:6)