Tesseract改进和图像预处理步骤

时间:2014-09-04 14:33:51

标签: ios ios5 ocr tesseract

我正在使用Tesseract库,下面是Tesseract的输入,

enter image description here

在实施的最初阶段,我只使用了" MRZ"身份证区。 但实际意图是扫描整个文件并获取身份证中的所有文本。

我已经完成了this document并提高了Tesseract的质量第一步是图像应该是300 dpi。

1)如何将ios中捕获的摄像机图像转换为300 dpi?

2)Tesseract提供最佳输出的最佳对比度和亮度水平应该是什么?

3)是否还有其他预处理步骤可以应用于图像以获得良好的准确度?

4)为了获得更好的准确度,建议的图像分辨率是多少?

5)我使用"int tesseract::TESSDLL_API::MeanTextConf"来获得置信度。有了这个每个角色的置信度分数,我有可能决定置信度得分是否超过某个百分比,那么识别的角色是否准确?如果我错了,请你解释一下" MeanTextConf"的用法。方法

1 个答案:

答案 0 :(得分:2)

我在图像预处理上写了几篇通用的OCR博客文章,并且前段时间“OCR如何最好地工作”。请在此处找到它们:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说,获得足够高的分辨率应该是第一步。低分辨率根据每个字母没有足够的信息来可靠地读取字符。然后我进行自适应二值化,其中图像被转换为​​黑色&白色使用阈值,背景应该是药房,字符应保持清晰,没有额外的噪音或洞。然后,可选地,可以执行分割到各个字段并分别使用特定设置处理每个字段,例如数字的“仅数字”和性别字段的“M | F”等。