使用PyTesseract从图像中识别文本时发生问题

时间:2018-10-29 07:26:35

标签: python python-tesseract

我试图为我们学校的网站制作一个自动登录程序,该程序需要从验证码中识别文本。因此,我从pip安装了pytesseract,并在PyCharm中运行了该程序:(图像位于目录 /Users/macintosh/Documents/PythonOutputs/2.jpg


import pytesseract

from PIL import Image

image = Image.open("/Users/macintosh/Documents/PythonOutputs/2.jpg")

text = pytesseract.image_to_string(image)

print(text)

但是发生了此错误:

  

回溯(最近通话最近):文件   “ /Users/macintosh/Library/Preferences/PyCharmCE2018.2/scratches/scratch_3.py”,   第5行       文字= pytesseract.image_to_string(image)

     

文件   “ /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/pytesseract/pytesseract.py”,   第294行,在image_to_string中       返回run_and_get_output(* args)

     

文件   “ /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/pytesseract/pytesseract.py”,   第202行,在run_and_get_output中       run_tesseract(** kwargs)

     

文件   “ /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/pytesseract/pytesseract.py”,   第178行,在run_tesseract中       引发TesseractError(status_code,get_errors(error_string))

     

pytesseract.pytesseract.TesseractError:(2,'用法:python   pytesseract.py [-l lang] input_file')

出什么问题了?

1 个答案:

答案 0 :(得分:0)

好吧,尽管我打赌(从您的行动来看)您的错误消息不是很清晰,但您自己还没有安装Tesseract

在pytessaract文档中指出:

  

Python-tesseract是Google Tesseract-OCR引擎的包装。

所以您应该安装实际的程序(即Tesseract)来完成这项工作。

相关问题