优化OCR图像

时间:2016-04-08 06:41:59

标签: bitmap xamarin.android ocr tesseract

我在开发使用Tesseract的应用时遇到了一些问题。问题是我似乎找不到足够快的方法来使图像适合快速OCR扫描。任何人都可以指出一个更快的方法/存在的库,我可以使用它来使事情更快地发生吗?

2 个答案:

答案 0 :(得分:0)

  1. 尝试使用OpenCV函数:adaptiveThreshold(...,CV_ADAPTIVE_THRESH_MEAN_C,...)。它工作得很快。
  2. 您可以使用更好的二值化算法(例如:SAUVOLA)。但它比Mean的二值化工作缓慢。请参阅来源:https://github.com/benob/opencv-utils/blob/master/include/binarize.h

答案 1 :(得分:0)

我认为Tesseract对你来说还不够。或许,解决问题的最佳方法是使用您自己的快速OCR解决方案。特别是,您需要更快地在OCR中执行这些步骤:纠偏,裁剪,二值化,查找连接组件,符号识别和文本后处理。

通常,OCR中最长的操作是符号识别。我想让你加快GPGPU的速度。

在开始自己的OCR实验之前,您可以熟悉收据识别研究的审核:http://rnd.azoft.com/applying-ocr-technology-receipt-recognition/
它可能对你有帮助。