我正在运行python 2.6.6并希望安装pytesseract包。提取和安装后,我可以从命令行调用pytesseract。但是我想在python中运行tesseract。我有以下代码(ocr.py):
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra'))
当我通过python ocr.py运行代码时,我得到以下输出:
Traceback (most recent call last):
File "ocr.py", line 6, in <module>
print(pytesseract.image_to_string(Image.open('test.png')))
File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string
raise TesseractError(status, errors)
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file')
test.png和test-european.jpg位于工作目录中。有人可以帮我运行这段代码吗? 我尝试过以下方法:
感谢任何帮助,因为我现在试图解决这个问题几个小时。
答案 0 :(得分:2)
tesseract_cmd
应该指向命令行计划tesseract
,而不是pytesseract
。
例如,在Ubuntu上,您可以使用以下命令安装程序:
sudo apt install tesseract-ocr
然后将变量设置为tesseract
或/usr/bin/tesseract
。