无法让pyocr识别数字

时间:2017-12-06 17:11:57

标签: python ocr tesseract python-tesseract

我从图像中提取了一些数字并将它们预处理成黑/白图像。这是我所拥有的一个例子:

enter image description here enter image description here

以下是尝试识别这些数字的简单脚本:

import pyocr
import pyocr.builders
from PIL import Image

tools = pyocr.get_available_tools()[0]
filename= "9.png"
text = tools.image_to_string(Image.open(filename), lang="eng", 
                             builder=pyocr.builders.DigitBuilder())
print text

但这没有任何结果。

我也尝试了TextBuilder(),但这也与任何内容都不匹配。

我读到可能放大图像和抗锯齿它可能会有所帮助,我生成了这个图像:

enter image description here

但这也无济于事。

我的tesseract版本:

tesseract 3.05.01
 leptonica-1.74.4
  libjpeg 9b : libpng 1.6.34 : libtiff 4.0.8 : zlib 1.2.8

为什么它不能识别我的数字?

0 个答案:

没有答案