在pytesseract中运行示例代码

时间:2016-10-19 12:38:12

标签: python tesseract python-tesseract

我正在运行python 2.6.6并希望安装pytesseract包。提取和安装后,我可以从命令行调用pytesseract。但是我想在python中运行tesseract。我有以下代码(ocr.py):

try:
     import Image
except ImportError:
     from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra'))

当我通过python ocr.py运行代码时,我得到以下输出:

Traceback (most recent call last):
  File "ocr.py", line 6, in <module>
    print(pytesseract.image_to_string(Image.open('test.png')))
  File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string
    raise TesseractError(status, errors)
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file')

test.png和test-european.jpg位于工作目录中。有人可以帮我运行这段代码吗? 我尝试过以下方法:

  1. 将tesseract_cmd调整为'pytesseract'
  2. 已安装tesseract-ocr
  3. 感谢任何帮助,因为我现在试图解决这个问题几个小时。

1 个答案:

答案 0 :(得分:2)

tesseract_cmd应该指向命令行计划tesseract,而不是pytesseract

例如,在Ubuntu上,您可以使用以下命令安装程序:

sudo apt install tesseract-ocr

然后将变量设置为tesseract/usr/bin/tesseract