我正在评估Intel IPP以加快我们代码的某些部分,例如,
等。我注意到这个page in the manual:
虽然其余的Intel IPP功能仅支持32位整数大小的信号或图像,但如果目标平台支持,则Intel IPP平台感知功能可以使用64位对象大小。 ...您可以通过函数名称中的
L
后缀区分Intel IPP平台感知功能,例如ippiAdd_8u_C1RSfs_L
。借助英特尔IPP平台感知功能,您可以克服32位大小限制。
在上面提到的三个中,只有排序具有64位感知功能。
所以,问题:这可能是对的吗? IPP 不能加速32位索引以外的阵列上的加/减?是否存在IPP中具有“平台感知”(64位)备选方案的主要功能列表?人们手动处理变通方法到32位限制,比如在2 ^ 30大小的块中循环调用add / abs函数吗?