矩阵向量多重加速与openmp或pthread

时间:2017-05-09 03:38:06

标签: matrix vector pthreads openmp

如下给出三个数组,我想通过内核X输入' - >获得点生成我想用OpenMP或pthread来加速这个功能,但是没有加速甚至更糟的是,任何人都有更好的方法吗?

  output[outN];
  input[inN];
  kernel[outN*inN];

  for(int i=0;i<outN;i++)
  {
          float sum = bias[i];
          for(int j=0;j<inN;j++)
                   sum += input[j]*kernel[i*inN+j];

          output[i] = sum;
 }

0 个答案:

没有答案