Android tesseract OCR改善了结果

时间:2015-01-09 07:25:17

标签: android performance image-processing ocr tesseract

我在我的Android应用程序中使用this进行OCR。

我正在使用默认的相机应用程序拍摄照片并将相同的图像输送到tesseract库。我目前正在使用this示例项目。当我处理任何图像时,我会得到不准确的结果以及许多随机的单个字母表。我看了很多帖子,发现我需要对我拍的照片做一些预处理,所以请帮帮我。关于图像处理的任何详细说明都将非常有用。

感谢。

This is the sample image

1 个答案:

答案 0 :(得分:1)

通过应用阈值过滤器,我得到了相当不错的结果(85%)。

请注意,您输入的图像不是最佳图像。

  • 模糊不清
  • 来自页面背面的文字似乎正在通过
  • 页面处于某个角度

如果你可以确保页面是正面的,没有文字从下面的页面渗出并且图像被聚焦,那么你应该看看在使用OpenCV的Tesseract之前应用Otsu或自适应阈值。我经常执行自己的阈值处理比将其留给Tesseract

更好

http://docs.opencv.org/trunk/doc/py_tutorials/py_imgproc/py_thresholding/py_thresholding.html