我已下载PyTesser并将其解压缩。
我在pytesser_v0.0.1
文件夹中并尝试在python解释器中运行sample usage代码:
from pytesser import *
print image_file_to_string('fnord.tif')
和输出:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pytesser.py", line 44, in image_file_to_string
call_tesseract(filename, scratch_text_name_root)
File "pytesser.py", line 21, in call_tesseract
proc = subprocess.Popen(args)
File "/usr/lib/python2.7/subprocess.py", line 679, in __init__
errread, errwrite)
File "/usr/lib/python2.7/subprocess.py", line 1259, in _execute_child
raise child_exception
OSError: [Errno 2] No such file or directory
注意:我在Ubuntu 12.10
Python 2.7.3
任何人都可以帮助我理解这个错误,我该怎么做才能解决它?
答案 0 :(得分:12)
尽管文档记录不尽如人意,但如果您不在Windows上,则需要为您的平台安装tesseract
二进制文件。在Ubuntu和其他基于Debian的Linux发行版上,apt-get install tesseract-ocr
。然后你可以运行:
python pytesser.py
使用测试文件phototest.tif
,fnord.tif
和fonts_test.png
来测试库。
答案 1 :(得分:0)
对于Windows上的初学者来说,使用pytesseract:
打开命令提示符
输入:pip install pytesseract
(这将在你的python上轻松安装pytesseract最后版本模块)
转到此链接并下载并安装tesseract-ocr引擎: https://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&can=2&q=
现在您已准备好使用pytesseract
有关更多信息,请参阅代码示例,请查看以下链接: http://www.manejandodatos.es/2014/11/ocr-python-easy/