我正在使用pytesseract对一些图像进行OCR。工作流程如下:
import pytesseract
from PIL import Image, ImageEnhance
from PIL import ImageFilter
# For local machine only
pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files (x86)\\Tesseract-OCR\\tesseract"
img = Image.open(image_file)
img = img.filter(ImageFilter.SMOOTH)
img_to_list = [i for i in str(pytesseract.image_to_string(img)).split("\n") if len(i.strip()) > 1]
本地计算机[Windows 7,Python 3.5]上的输出是稳定的。然而,在this image中显示,在PythonAnywhere上运行脚本会产生残破的文本。
如果有人可以解释为什么结果不相同,我将不胜感激。