应用错误收集

pytesseract努力识别字体编号和7个seg数字的干净的黑白图片（python）

时间：2018-08-08 16:57:54

标签： python opencv tesseract python-tesseract

我一直试图让tesseract识别这张图片上的数字：

但是运行脚本时，输出为空，这意味着不能

任何想法如何使其起作用？似乎应该没有不好的时间将图像转换为文本，并且同样发生了7段数字并尝试在此图像的噪声较大的彩色版本上运行tesseract时，在此示例中，实际上看起来确实工作良好：

关于如何使其工作的任何提示？

感谢您的帮助

1 个答案:

答案 0 :(得分：0)

Tesseract对图像边界非常敏感，因此在过滤后的图像周围添加大约20个像素边界将解决此问题。

关于tesseract问题-LSTM (tess 4.*) might not be the best approach中所述的7段字体，并且有不同的库可以更好地处理此问题。您可以尝试this tessdata进行tesseract 3.4;