python - Tesseract无法区分零和O

我有一幅大图像，需要从中提取一些信息。我正在使用Python opencv库进行图像增强。使用opencv方法提取了我感兴趣的一部分图像。它在下面给出。

Tesseract无法区分0和O。它给出的输出均为全零。我尝试了--psm选项6和其他选项，但无济于事。我正在Windows上使用tesseract（v3）的最新稳定版本。

我正在继续解决这个问题。任何帮助，将不胜感激。谢谢。

编辑：

我为此找到了解决方案。来自tesseract的二手货箱输出。需要给makebox作为tesseract命令的参数。框输出包含每个读取的字符周围的“框”的X和Y坐标。我导出了宽度与高度的比率，并使用一些输入图像训练了逻辑回归模型来预测输出0或O。然后将这种训练后的模型用于测试图像，它就像一个魅力一样工作。

Tesseract无法区分零和O

0 个答案: