pytesseract努力识别字体编号和7个seg数字的干净的黑白图片(python)

时间:2018-08-08 16:57:54

标签: python opencv tesseract python-tesseract

我一直试图让tesseract识别这张图片上的数字: Filtered Img

但是运行脚本时,输出为空,这意味着不能

任何想法如何使其起作用?似乎应该没有不好的时间将图像转换为文本,并且同样发生了7段数字 并尝试在此图像的噪声较大的彩色版本上运行tesseract时,在此示例中,实际上看起来确实工作良好:

Noisy img

关于如何使其工作的任何提示?

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

Tesseract对图像边界非常敏感,因此在过滤后的图像周围添加大约20个像素边界将解决此问题。

关于tesseract问题-LSTM (tess 4.*) might not be the best approach中所述的7段字体,并且有不同的库可以更好地处理此问题。您可以尝试this tessdata进行tesseract 3.4;