带tesseract的OCR,预处理图像

时间:2019-05-31 03:08:24

标签: python python-3.x image-processing ocr python-tesseract

我需要从图像中提取数字,如下图所示,我现在正在使用tesseract,但是它不起作用。有人可以帮助我对图像进行预处理,然后再将其输入tesseract吗?

enter image description here

1 个答案:

答案 0 :(得分:0)

我认为tesseract不是适合的工具,Tesseract只能处理非常清晰的字母。
如果您的数字都与图片中的数字相同,则可以使用opencv ORB检测器https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_feature2d/py_orb/py_orb.html
或者,如果不起作用,则可以使用一些深度学习的方法,例如SSD Keras或YOLO。
https://github.com/pierluigiferrari/ssd_keras
另一种选择是分解数字(如果大小都相同则很容易),并使用keras创建一个非常简单的卷积神经网络。
https://keras.io/