我从图像中提取了一些数字并将它们预处理成黑/白图像。这是我所拥有的一个例子:
以下是尝试识别这些数字的简单脚本:
import pyocr
import pyocr.builders
from PIL import Image
tools = pyocr.get_available_tools()[0]
filename= "9.png"
text = tools.image_to_string(Image.open(filename), lang="eng",
builder=pyocr.builders.DigitBuilder())
print text
但这没有任何结果。
我也尝试了TextBuilder()
,但这也与任何内容都不匹配。
我读到可能放大图像和抗锯齿它可能会有所帮助,我生成了这个图像:
但这也无济于事。
我的tesseract版本:
tesseract 3.05.01
leptonica-1.74.4
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.8 : zlib 1.2.8
为什么它不能识别我的数字?