我正在建立/培训Tesseract,以便从拍摄的照片中识别护照MRZ代码。在将照片/图像发送到Tesseract引擎之前,我正在应用以下图像预处理技术:
此外,我已经使用正确的字体(OCR-B)训练了Tesseract引擎,创建了大量的盒子文件(来自35个左右的样本,其中包含从OCR-B字体的文本样本中提取的照片),修复了任何错误。盒子文件,创建训练文件,最后用我的所有样本训练Tesseract引擎并生成训练有素的数据文件。
然而即使在C#(引擎模式=默认,pagesegmode =自动)中使用我的自定义训练数据的所有这个Tesseract 3.04仍然会犯下如下错误:
现在我的问题是,我能做些什么来使Tesseract产生更准确的结果?我的30个训练样本包括以下照片:
答案 0 :(得分:1)
使用imagemagick转换程序扩展至480%。还介绍了锐化和美白。带来了显着的改进。我看到比许多购买OCR程序更好的结果。