标签: cuda kepler
根据GK110 whitepaper,每个SMX最多有64个经线,最大线程容量为2048个线程。
我的问题是:每个SMX是否始终以64的最大驻留扭曲数运行(假设没有线程偏差,块大小是64的倍数)?
我有理由相信,如果你在SMX上的线程数< 1024,每个多处理器最多只能获得32个warp。
(我相信这是因为当运行相同的代码时,当1个程序段的线程数为1024时,我的同步时钟Fermi卡显示与我的Kepler卡类似的速度)