如何在OpenCV中删除不需要的线路/噪音?

时间:2014-04-06 19:39:03

标签: java android c++ opencv

我正在为android开发一个OCR应用程序(构建为java Application)。我想检测从相机捕获的图像中的文本和预处理我正在使用OpenCV,但我得到一些额外的行,正在被读作文本,我已遵循这种方法:

1-RGB到GreyScale 2门限 3高斯模糊 4中位数模糊 5扩张 6-侵蚀

结果至少比以前好,但仍然没有得到正确的结果。 我怎样才能消除这种噪音,这些过滤器的一般序列是什么,可以应用于任何图像以改善OCR的结果。 我是OpenCV的新手,请指导我。 感谢。

old Image


Updated Image


从上面的图像我能够找到3号的结果,但只有当所有的轮廓被绘制出来时才是我不想要的东西,因为还有噪音。我在这里错过了什么。不知道该做些什么。 修订代码:

package simple_contours;

import java.util.ArrayList;
import java.util.List;

import org.opencv.core.Core;
import org.opencv.core.CvType;
import org.opencv.core.Mat;
import org.opencv.core.MatOfPoint;
import org.opencv.core.Point;
import org.opencv.core.Rect;
import org.opencv.core.Scalar;
import org.opencv.core.Size;
import org.opencv.highgui.Highgui;
import org.opencv.imgproc.Imgproc;

public class Main {

    public static void main(String[] args) {
        System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
        Mat src_img,src_grey,src_blur,src_thresh,src_dilate,dest_img; 
        src_img=Highgui.imread("n_num.jpg",Imgproc.COLOR_BGR2GRAY);


        src_grey=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
        src_blur=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
        src_thresh=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
        src_dilate=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
        dest_img=Mat.zeros(640,480, CvType.CV_8UC3);
        Core.bitwise_not(dest_img, dest_img);
        Highgui.imwrite("dest.jpg", dest_img);

        Imgproc.cvtColor(src_img, src_grey, Imgproc.COLOR_BGR2GRAY);
        Imgproc.GaussianBlur(src_grey, src_blur, new Size(3, 3), 0);
        Imgproc.threshold(src_blur, src_thresh, 80, 255, Imgproc.THRESH_BINARY_INV);
        Imgproc.dilate(src_thresh, src_dilate, Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(2, 2)));

        Highgui.imwrite("Threshold.jpg", src_thresh);
        Highgui.imwrite("Dilate.jpg", src_dilate);




          List<MatOfPoint> contours = new ArrayList<MatOfPoint>();  
          Mat heirarchy= new Mat();
          Point shift=new Point(150,0);
          Imgproc.findContours(src_dilate, contours,heirarchy, Imgproc.RETR_TREE,Imgproc.CHAIN_APPROX_SIMPLE,shift);
          double[] cont_area =new double[contours.size()]; 

             for(int i=0; i< contours.size();i++)
             { 
                Rect rect = Imgproc.boundingRect(contours.get(i));
                cont_area[i]=Imgproc.contourArea(contours.get(i));

                System.out.println("Hight: "+rect.height);
                System.out.println("WIDTH: "+rect.width);
                System.out.println("AREA: "+cont_area[i]);
              //System.out.println(rect.x +","+rect.y+","+rect.height+","+rect.width);

                  Core.rectangle(src_img, new Point(rect.x,rect.y), new Point(rect.x+rect.width,rect.y+rect.height),new Scalar(0,0,255));
                  Imgproc.drawContours(dest_img, contours, i, new Scalar(0,0,0),-1,8,heirarchy,2,shift);
                  Core.rectangle(dest_img, new Point(rect.x,rect.y), new Point(rect.x+rect.width,rect.y+rect.height),new Scalar(0,255,0));
         }

             Highgui.imwrite("Final.jpg", dest_img);
             Highgui.imwrite("Original.jpg", src_img);
    }

}

3 个答案:

答案 0 :(得分:7)

我认为你只能使用侵蚀/扩张选项。问题在于噪音不仅仅是噪音,而且包含的伪像不一定与您试图检测到的某些角色不同。

我建议解决方案需要检测图像中的轮廓。首先,您应该准备好图像,使其更适合轮廓加工过程。

我过去使用过以下序列:

  • 高斯模糊
  • adaptiveThreshold
  • negativeImage
  • 扩张

现在你可以找到轮椅。这应该挑出字母和不受欢迎的人工制品。然后你需要消除人工制品,你可能需要一些策略,例如:

  • 计算出边界框的区域,并消除那些区域太小而不能成为字母
  • 的区域
  • 检查边界框的宽度与高度:消除高度太小的

可能有更复杂的方法,例如试图找到穿过较大轮廓中间的轴,这将给出角色的位置和方向(比如旋转的Rect);您可以使用该信息忽略不在区域内的所有其他像素。

对不起,这不是一个简单的解决方案,但它是一个复杂的问题,所以你可能需要进行一些实验并建立多种策略来删除不需要的文物。

答案 1 :(得分:0)

尝试侵蚀图片(试验内核大小),然后扩张返回以恢复。

如果线/像素噪声(剩余噪声或原始噪声)非常小,请尝试中值模糊。 它应该有用,如果没有,请分享你的结果以便进一步开展工作。

答案 2 :(得分:0)

我通过使用来自Heirarchy的信息来解决问题,第四个索引值包含有关父轮廓的信息,因此应绘制具有-1值的轮廓。这解决了填充轮廓问题。 :)