Tesseract无法区分零和O

时间:2018-07-19 07:23:59

标签: python tesseract

我有一幅大图像,需要从中提取一些信息。我正在使用Python opencv库进行图像增强。使用opencv方法提取了我感兴趣的一部分图像。它在下面给出。

enter image description here

Tesseract无法区分0和O。它给出的输出均为全零。我尝试了--psm选项6和其他选项,但无济于事。我正在Windows上使用tesseract(v3)的最新稳定版本。

我正在继续解决这个问题。任何帮助,将不胜感激。谢谢。

编辑:

我为此找到了解决方案。来自tesseract的二手货箱输出。需要给makebox作为tesseract命令的参数。框输出包含每个读取的字符周围的“框”的XY坐标。我导出了宽度与高度的比率,并使用一些输入图像训练了逻辑回归模型来预测输出0或O。然后将这种训练后的模型用于测试图像,它就像一个魅力一样工作。

0 个答案:

没有答案