我有一幅大图像,需要从中提取一些信息。我正在使用Python opencv库进行图像增强。使用opencv方法提取了我感兴趣的一部分图像。它在下面给出。
Tesseract无法区分0和O。它给出的输出均为全零。我尝试了--psm
选项6和其他选项,但无济于事。我正在Windows上使用tesseract(v3)的最新稳定版本。
我正在继续解决这个问题。任何帮助,将不胜感激。谢谢。
编辑:
我为此找到了解决方案。来自tesseract的二手货箱输出。需要给makebox
作为tesseract命令的参数。框输出包含每个读取的字符周围的“框”的X
和Y
坐标。我导出了宽度与高度的比率,并使用一些输入图像训练了逻辑回归模型来预测输出0或O。然后将这种训练后的模型用于测试图像,它就像一个魅力一样工作。