PyTesser简单的使用错误

时间:2013-08-19 20:54:18

标签: python ocr

我已下载PyTesser并将其解压缩。

我在pytesser_v0.0.1文件夹中并尝试在python解释器中运行sample usage代码:

from pytesser import *
print image_file_to_string('fnord.tif')

和输出:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "pytesser.py", line 44, in image_file_to_string
    call_tesseract(filename, scratch_text_name_root)
  File "pytesser.py", line 21, in call_tesseract
    proc = subprocess.Popen(args)
  File "/usr/lib/python2.7/subprocess.py", line 679, in __init__
    errread, errwrite)
  File "/usr/lib/python2.7/subprocess.py", line 1259, in _execute_child
    raise child_exception
OSError: [Errno 2] No such file or directory

注意:我在Ubuntu 12.10 Python 2.7.3

任何人都可以帮助我理解这个错误,我该怎么做才能解决它?

2 个答案:

答案 0 :(得分:12)

尽管文档记录不尽如人意,但如果您不在Windows上,则需要为您的平台安装tesseract二进制文件。在Ubuntu和其他基于Debian的Linux发行版上,apt-get install tesseract-ocr。然后你可以运行:

python pytesser.py

使用测试文件phototest.tiffnord.tiffonts_test.png来测试库。

答案 1 :(得分:0)

对于Windows上的初学者来说,使用pytesseract:

  1. 打开命令提示符

  2. 输入:pip install pytesseract (这将在你的python上轻松安装pytesseract最后版本模块)

  3. 转到此链接并下载并安装tesseract-ocr引擎: https://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&can=2&q=

  4. 现在您已准备好使用pytesseract

  5. 有关更多信息,请参阅代码示例,请查看以下链接: http://www.manejandodatos.es/2014/11/ocr-python-easy/