我目前正在使用tesseract扫描收据。质量不是很好所以我读了这篇关于如何改进它的文章:https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#noise-removal。我实现了调整大小,纠偏(对齐)和高斯模糊。但是除了偏斜校正之外,它们似乎都没有对OCR的准确性产生积极影响。这是我调整大小和高斯模糊的代码。我做错了吗?如果没有,我还能做些什么来帮助?
代码:
+(UIImage *) prepareImage: (UIImage *)image{
//converts UIImage to Mat format
Mat im = cvMatWithImage(image);
//grayscale image
Mat gray;
cvtColor(im, gray, CV_BGR2GRAY);
//deskews text
//did not provide code because I know it works
Mat preprocessed = preprocess2(gray);
double skew = hough_transform(preprocessed, im);
Mat rotated = rot(im,skew* CV_PI/180);
//resize image
Mat scaledImage = scaleImage(rotated, 2);
//Guassian Blur
GaussianBlur(scaledImage, scaledImage, cv::Size(1, 1), 0, 0);
return UIImageFromCVMat(scaledImage);
}
// Organization -> Resizing
Mat scaleImage(Mat mat, double factor){
Mat resizedMat;
double width = mat.cols;
double height = mat.rows;
double aspectRatio = width/height;
resize(mat, resizedMat, cv::Size(width*factor*aspectRatio, height*factor*aspectRatio));
return resizedMat;
}
收据:
答案 0 :(得分:1)
如果您阅读Tesseract文档,您将看到tesseract引擎最适用于正方形中单行的文本。通过它,整个收据图像降低了引擎的准确性。您需要做的是使用新的iOS框架CITextFeature将收据中的文本检测到多个图像块。然后,只有您可以将这些图像传递给tesseract进行处理。