使用流是否有可能在Kepler 3.5 GPU中的同一流多处理器上拥有多个独特的内核?即在具有15个SM的Kepler GPU上同时运行30个大小为<<<1,1024>>>
的内核?
答案 0 :(得分:6)
在计算能力3.5设备上,它可能是可能的。
这些设备支持每个GPU最多32个并发内核和2048个线程对等多处理器。每个多处理器有64k个寄存器,如果每个线程的寄存器占用空间少于16个,每个块的共享内存少于24kb,则两个1024个线程的块可以同时运行。
您可以找到所有这些是CUDA编程指南附录中的硬件描述。