OpenMP边缘检测滤波器并行性:需要更长时间

时间:2014-09-26 07:07:38

标签: opencv openmp sobel

我想将sobel滤镜应用于大图像。

我使用OpenMP进行并行化以优化计算时间。

在使用并行优化之后,我注意到它需要比预期更长的时间。这是代码:

#include<iostream>
#include<cmath>
#include<opencv2/imgproc/imgproc.hpp>
#include<opencv2/highgui/highgui.hpp>

using namespace std;
using namespace cv;


// Computes the x component of the gradient vector
// at a given point in a image.
// returns gradient in the x direction
int xGradient(Mat image, int x, int y)
{
    return image.at<uchar>(y-1, x-1) +
                2*image.at<uchar>(y, x-1) +
                 image.at<uchar>(y+1, x-1) -
                  image.at<uchar>(y-1, x+1) -
                   2*image.at<uchar>(y, x+1) -
                    image.at<uchar>(y+1, x+1);
}

// Computes the y component of the gradient vector
// at a given point in a image
// returns gradient in the y direction

int yGradient(Mat image, int x, int y)
{
    return image.at<uchar>(y-1, x-1) +
                2*image.at<uchar>(y-1, x) +
                 image.at<uchar>(y-1, x+1) -
                  image.at<uchar>(y+1, x-1) -
                   2*image.at<uchar>(y+1, x) -
                    image.at<uchar>(y+1, x+1);
}




int main()
{
const clock_t begin_time = clock();
      Mat src, dst;
      int gx, gy, sum;

      // Load an image
      src = imread("/home/cgross/Downloads/pano.jpg", 0);
      dst = src.clone();
      if( !src.data )
      { return -1; }

#pragma omp parallel for private(gx, gy, sum) shared(dst)
        for(int y = 0; y < src.rows; y++)
            for(int x = 0; x < src.cols; x++)
                dst.at<uchar>(y,x) = 0.0;

#pragma omp parallel for private(gx, gy, sum) shared(dst)

        for(int y = 1; y < src.rows - 1; y++){

            for(int x = 1; x < src.cols - 1; x++){
                gx = xGradient(src, x, y);
                gy = yGradient(src, x, y);
                sum = abs(gx) + abs(gy);
                sum = sum > 255 ? 255:sum;
                sum = sum < 0 ? 0 : sum;
                dst.at<uchar>(y,x) = sum;
            }
        }

        namedWindow("final", WINDOW_NORMAL);
        imshow("final", dst);

        namedWindow("initial", WINDOW_NORMAL);
        imshow("initial", src);

std::cout << float( clock () - begin_time ) /  CLOCKS_PER_SEC<<endl;
      waitKey();


    return 0;
}

如果我注释掉pragma(禁用OpenMP),计算速度会更快(10秒),我不知道问题出在哪里。

1 个答案:

答案 0 :(得分:0)

我会考虑使用其中任何一种,而不是编写自己的Soebel。

1)内置OpenCv功能 http://docs.opencv.org/modules/imgproc/doc/filtering.html?highlight=sobel#sobel

2)创建Soebel内核并使用OpenCv filter2D()函数。其他库,平台等具有类似的功能,用于在映像上传递内核,并且许多已经过优化。例如,我认为iOS有一种叫做vImage的东西。

然后,您可以将这些时间与自定义代码进行比较。

你说你有一个“大”的图像,但这并不意味着我们在谈论多少像素?

您可以将图像分割为多个部分并对每个部分执行过滤(使用线程等),然后将这些部分组合回来制作新图像。我做得很好。

我也会读到这个:

http://developer.amd.com/tools-and-sdks/opencl-zone/opencl-resources/programming-in-opencl/image-convolution-using-opencl/