pytesseract无法识别二值化图像中的数字

时间:2019-10-11 03:01:56

标签: python tesseract python-tesseract

我目前面临pytesseract问题,该软件无法在该图像中检测到数字:

enter image description here

由于某种原因,pytesseract不想识别该图像中的数字。有什么建议么?这是我的代码:

import pytesseract
from PIL import ImageEnhance, ImageFilter, Image

img = r'/content/inv_thresh.png'
​
str = pytesseract.image_to_string(Image.open(img), lang='eng', \
       config='--psm 8 --oem 3 -c tessedit_char_whitelist=0123456789')

它返回字符串COTO

1 个答案:

答案 0 :(得分:0)

  1. 为什么指定--oem 3Default, based on what is available.
  2. 您使用哪种型号?哪个tesseract版本?
  3. Tesseract希望没有伪影的清晰图像可以提供正确的结果=>您将需要更好的预处理图像。

在最近的tesseract(4.1 / 5.0alpha)下,我在tessdata_best模式下获得了以下结果:

tesseract a9Uq4.png - --psm 8 --dpi 70
00308