Pytesseract图像OCR给出不一致的结果

时间:2018-10-17 09:00:52

标签: python python-3.x ocr python-tesseract

我正在使用pytesseract对一些图像进行OCR。工作流程如下:

import pytesseract
from PIL import Image, ImageEnhance
from PIL import ImageFilter

# For local machine only
pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files (x86)\\Tesseract-OCR\\tesseract"  

img = Image.open(image_file)  
img = img.filter(ImageFilter.SMOOTH)
img_to_list = [i for i in str(pytesseract.image_to_string(img)).split("\n") if len(i.strip()) > 1]

本地计算机[Windows 7,Python 3.5]上的输出是稳定的。然而,在this image中显示,在PythonAnywhere上运行脚本会产生残破的文本。

如果有人可以解释为什么结果不相同,我将不胜感激。

0 个答案:

没有答案