我对openmp的了解几乎没有,所以在尝试做一些可能没有意义的事情之前我更愿意问:
我有一些用于位图操作的例程(其中每个像素的结果将不依赖于其他像素)使用内联霓虹组件为arm-v7安卓设备编写。
现在我想使用openmp来进一步加速它:将位图数组分成4个(例如)区域并在paral.lel中执行。
但我不知道是否存在以下限制:
功能结构是这样的
void ProcessBitmapArray( int* wArray, int wWidth, int wHeight, const char* bOptions)
{
int j;
for(j=0;j<wHeight;j++){
asm volatile(
// neon code here
);
}
}