我正在为android开发一个OCR应用程序(构建为java Application)。我想检测从相机捕获的图像中的文本和预处理我正在使用OpenCV,但我得到一些额外的行,正在被读作文本,我已遵循这种方法:
1-RGB到GreyScale 2门限 3高斯模糊 4中位数模糊 5扩张 6-侵蚀
结果至少比以前好,但仍然没有得到正确的结果。 我怎样才能消除这种噪音,这些过滤器的一般序列是什么,可以应用于任何图像以改善OCR的结果。 我是OpenCV的新手,请指导我。 感谢。
从上面的图像我能够找到3号的结果,但只有当所有的轮廓被绘制出来时才是我不想要的东西,因为还有噪音。我在这里错过了什么。不知道该做些什么。 修订代码:
package simple_contours;
import java.util.ArrayList;
import java.util.List;
import org.opencv.core.Core;
import org.opencv.core.CvType;
import org.opencv.core.Mat;
import org.opencv.core.MatOfPoint;
import org.opencv.core.Point;
import org.opencv.core.Rect;
import org.opencv.core.Scalar;
import org.opencv.core.Size;
import org.opencv.highgui.Highgui;
import org.opencv.imgproc.Imgproc;
public class Main {
public static void main(String[] args) {
System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
Mat src_img,src_grey,src_blur,src_thresh,src_dilate,dest_img;
src_img=Highgui.imread("n_num.jpg",Imgproc.COLOR_BGR2GRAY);
src_grey=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
src_blur=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
src_thresh=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
src_dilate=new Mat(src_img.size(), Core.DEPTH_MASK_8U);
dest_img=Mat.zeros(640,480, CvType.CV_8UC3);
Core.bitwise_not(dest_img, dest_img);
Highgui.imwrite("dest.jpg", dest_img);
Imgproc.cvtColor(src_img, src_grey, Imgproc.COLOR_BGR2GRAY);
Imgproc.GaussianBlur(src_grey, src_blur, new Size(3, 3), 0);
Imgproc.threshold(src_blur, src_thresh, 80, 255, Imgproc.THRESH_BINARY_INV);
Imgproc.dilate(src_thresh, src_dilate, Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(2, 2)));
Highgui.imwrite("Threshold.jpg", src_thresh);
Highgui.imwrite("Dilate.jpg", src_dilate);
List<MatOfPoint> contours = new ArrayList<MatOfPoint>();
Mat heirarchy= new Mat();
Point shift=new Point(150,0);
Imgproc.findContours(src_dilate, contours,heirarchy, Imgproc.RETR_TREE,Imgproc.CHAIN_APPROX_SIMPLE,shift);
double[] cont_area =new double[contours.size()];
for(int i=0; i< contours.size();i++)
{
Rect rect = Imgproc.boundingRect(contours.get(i));
cont_area[i]=Imgproc.contourArea(contours.get(i));
System.out.println("Hight: "+rect.height);
System.out.println("WIDTH: "+rect.width);
System.out.println("AREA: "+cont_area[i]);
//System.out.println(rect.x +","+rect.y+","+rect.height+","+rect.width);
Core.rectangle(src_img, new Point(rect.x,rect.y), new Point(rect.x+rect.width,rect.y+rect.height),new Scalar(0,0,255));
Imgproc.drawContours(dest_img, contours, i, new Scalar(0,0,0),-1,8,heirarchy,2,shift);
Core.rectangle(dest_img, new Point(rect.x,rect.y), new Point(rect.x+rect.width,rect.y+rect.height),new Scalar(0,255,0));
}
Highgui.imwrite("Final.jpg", dest_img);
Highgui.imwrite("Original.jpg", src_img);
}
}
答案 0 :(得分:7)
我认为你只能使用侵蚀/扩张选项。问题在于噪音不仅仅是噪音,而且包含的伪像不一定与您试图检测到的某些角色不同。
我建议解决方案需要检测图像中的轮廓。首先,您应该准备好图像,使其更适合轮廓加工过程。
我过去使用过以下序列:
现在你可以找到轮椅。这应该挑出字母和不受欢迎的人工制品。然后你需要消除人工制品,你可能需要一些策略,例如:
可能有更复杂的方法,例如试图找到穿过较大轮廓中间的轴,这将给出角色的位置和方向(比如旋转的Rect);您可以使用该信息忽略不在区域内的所有其他像素。
对不起,这不是一个简单的解决方案,但它是一个复杂的问题,所以你可能需要进行一些实验并建立多种策略来删除不需要的文物。
答案 1 :(得分:0)
尝试侵蚀图片(试验内核大小),然后扩张返回以恢复。
如果线/像素噪声(剩余噪声或原始噪声)非常小,请尝试中值模糊。 它应该有用,如果没有,请分享你的结果以便进一步开展工作。
答案 2 :(得分:0)
我通过使用来自Heirarchy的信息来解决问题,第四个索引值包含有关父轮廓的信息,因此应绘制具有-1值的轮廓。这解决了填充轮廓问题。 :)