我第一次尝试使用pytesseract
。我也不太喜欢python。我在桌面上创建了一个名为python_test
的新文件夹。我在Mac上。在这个文件夹中,我有一个test.png
文件和一个py脚本:
from pytesseract import image_to_string
from PIL import Image
print image_to_string(Image.open('test.png'))
print image_to_string(Image.open('test-english.jpg'), lang='eng')
所以从我的终端,我进入python_test文件夹然后我正在运行python read.py
然后我有以下错误:
Traceback (most recent call last):
File "read.py", line 4, in <module>
print image_to_string(Image.open('test.png'))
File "/anaconda/anaconda/lib/python2.7/site-packages/pytesseract/pytesseract.py", line 161, in image_to_string
config=config)
File "/anaconda/anaconda/lib/python2.7/site-packages/pytesseract/pytesseract.py", line 94, in run_tesseract
stderr=subprocess.PIPE)
File "/anaconda/anaconda/lib/python2.7/subprocess.py", line 711, in __init__
errread, errwrite)
File "/anaconda/anaconda/lib/python2.7/subprocess.py", line 1343, in _execute_child
raise child_exception
OSError: [Errno 2] No such file or directory
我做错了什么?
答案 0 :(得分:3)
我遇到了与您相同的错误,安装tesseract
软件包修复它(或tesseract-ocr
在debian / ubuntu上)。它包含由pytesseract
引用的本机代码库。
如果没有安装底层本机库,那么图像加载错误似乎是一种奇怪的方法,如果没有安装,那么库就会失败。
安装使用命令(根据需要插入sudo)
的MacOS
brew install tesseract
ubuntu
apt install tesseract-ocr
答案 1 :(得分:1)
我第一次使用image_to_string
时也遇到了错误。
您必须更改pytesseract.py
文件中的以下行。
tesseract_cmd = 'C:\\Tesseract-OCR\\tesseract'
注意:我正在使用Windows。