如下给出三个数组,我想通过内核X输入' - >获得点生成我想用OpenMP或pthread来加速这个功能,但是没有加速甚至更糟的是,任何人都有更好的方法吗?
output[outN];
input[inN];
kernel[outN*inN];
for(int i=0;i<outN;i++)
{
float sum = bias[i];
for(int j=0;j<inN;j++)
sum += input[j]*kernel[i*inN+j];
output[i] = sum;
}