我打算实现一个OpenCL内核函数,并根据在此函数中完成的计算(操作到数据传输率),我想确定它值得继续这样做。因此,根据我的估计,我发现操作到数据传输率大约是12-15,无论在主机和设备之间传输的数据输入/输出的大小如何,这都是恒定的。
对于这种情况,您认为从主机或设备进行计算会更好吗?
由于
答案 0 :(得分:2)
没有更多细节,人们只能猜测......取决于你的意思"操作" (OpenCL级别?GPU指令级别?),"数据传输" (bytes / WItem please),是否可以使用本地内存,主机是什么硬件,设备是什么硬件......