我很好奇:在GPU上,是否有可能在几个时钟周期内并行添加数百万个数字 - 或者这个操作在理论上是不可能并行化的?
通过GPU,我指的是来自nVidia或AMD的任何产品,例如:特斯拉M2050。
答案 0 :(得分:4)
只有一个时钟周期,还是“少数”?如果是前者,那么没有,任何GPU中都没有足够的硬件资源可以在同一个时钟周期内添加数百万的双打。如果你的意思是“相对于典型CPU的时钟周期相对较少”,那么是的。您希望执行的添加类型也是一个因素。例如,您是否对数组的元素进行了减少求和?或者将两个向量一起添加?或者向向量添加常量?这些都在GPU上具有不同的性能特征。