Tesseract image_to_string为空

时间:2019-02-06 20:20:14

标签: image-processing python-imaging-library ocr tesseract

我在图像image_ball.png中有一个简单的文本。通常,Tesseract的OCR效果很好,但是对于此特定图像,它始终返回空字符串。 image_ball.png

In [1]: from PIL import Image

In [2]: from pytesseract import image_to_string

In [3]: img = Image.open("image_ball.png")

In [4]: image_to_string(img)
Out[5]: u''

我找不到最新的解决方法。 我如何找出这张图片出了什么问题?

版本为:

In [6]: import PIL

In [7]: PIL.__version__
Out[7]: '4.0.0'


$ tesseract -v
tesseract 4.0.0
 leptonica-1.77.0
  libgif 5.1.4 : libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found SSE

编辑

我也尝试将图像转换为黑白。但是它仍然未被认可。

In [6]: image = img.convert('L') 

In [7]: image_to_string(image)
Out[8]: u''

编辑2

对于Tesseract,单个字符似乎也是一个问题。放大或侵蚀图像似乎无济于事:image_1.png image_1.png

1 个答案:

答案 0 :(得分:1)

放大图像可提供所需的输出。

image = cv2.imread("Ball.png", cv2.IMREAD_GRAYSCALE) 
cv2.dilate(image, (5, 5), image)
print(pytesseract.image_to_string(image), config='--psm 7')