使用按位运算优化openCL计算

时间:2016-04-21 21:09:19

标签: c opencl

让我首先说明我的目标:我试图比较两个13位整数:>,<,和=;我必须进行数万次这样的计算,所以我必须尽可能地优化它。

我的程序目前使用Python 2.7和pyopencl来实现这个计算。我的ATI Radeon 6870平均大约有800个GFlops,现在很好。

所以这是我的问题:如果不是在4字节浮点数上关注&lt ;,>和=运算符(正如我现在所做),我编写了按位函数来处理<,>和=,我能够一次处理2到13位的对象,这会增加我的速度吗?或者C是否已经有最有效的方法来查找<,>和=(显然)为浮点数?

0 个答案:

没有答案