我尝试使用pytesseract:
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = 'C:\\Python27\\scripts\\pytesseract.exe'
im = Image.open('Download.png')
print pytesseract.image_to_string(im)
但我收到了这个错误:
Traceback (most recent call last):
File "C:/Python27/ocr.py", line 11, in <module>
print pytesseract.image_to_string(im)
File "C:\Python27\lib\site-packages\pytesseract\pytesseract.py", line
125, in image_to_string
raise TesseractError(status, errors)
TesseractError: (2, u'Usage: python pytesseract.py [-l lang] input_file')
有什么问题?
答案 0 :(得分:0)
您需要使用here可用的Windows Installer安装tesseract。然后,您应将python包装器安装为:
pip install pytesseract
然后,在导入pytesseract库之后,还应在脚本中设置tesseract路径,如下所示(请注意,安装路径可能会因您的情况而被修改!):
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
注意:它已经在Anaconda3,Anaconda2,Py3和Py2上进行了测试,没有任何问题。
答案 1 :(得分:-1)
我认为您的路径'C:\ Python27 \ scripts \ pytesseract.exe'有问题,这似乎指向pytessaract.py代码(因此错误上有pytessaract.py - 确切的错误是在pytessaract.py的主要功能中提到,仅当名称 ==“主要”时才会运行。
路径必须实际指向tessaract.exe,单独下载。查看链接(https://pypi.python.org/pypi/pytesseract)中安装的第3个点。
这必须要做,因为pytesseract只是tessaract程序周围的python包装器,所以它调用本地机器上的tessaract.exe来进行实际的ocr工作。