英特尔IPP适用于超过32位大小限制的阵列?

时间:2018-01-10 12:51:19

标签: c++ c 64-bit numerical-methods intel-ipp

我正在评估Intel IPP以加快我们代码的某些部分,例如,

等。我注意到这个page in the manual

  

虽然其余的Intel IPP功能仅支持32位整数大小的信号或图像,但如果目标平台支持,则Intel IPP平台感知功能可以使用64位对象大小。 ...您可以通过函数名称中的L后缀区分Intel IPP平台感知功能,例如ippiAdd_8u_C1RSfs_L。借助英特尔IPP平台感知功能,您可以克服32位大小限制。

在上面提到的三个中,只有排序具有64位感知功能。

所以,问题:这可能是对的吗? IPP 不能加速32位索引以外的阵列上的加/减?是否存在IPP中具有“平台感知”(64位)备选方案的主要功能列表?人们手动处理变通方法到32位限制,比如在2 ^ 30大小的块中循环调用add / abs函数吗?

0 个答案:

没有答案