标签: python gpu nvidia pyopencl tesla
当线程数增加超过一定数量时,GPU的速度会呈指数下降吗?
我看到全局数据中其他数组的大小并不重要。我总是分配线程数=正在考虑的数据中的事务数。 对于特斯拉K80,我看到速度指数下降超过30290线程。 如果为true,最佳做法是保持线程数低并迭代数据以获得最佳速度的结果。 如何为GPU找到最佳线程数?
由于