从tesseract导入image_to_string时出现Python错误

时间:2013-02-01 05:47:51

标签: python ocr tesseract

我最近使用了tesseract OCR和python,当我尝试从tesseract导入image_to_string时,我一直收到错误。

导致问题的代码:

# Perform OCR using tesseract-ocr library
from tesseract import image_to_string
image = Image.open('input-NEAREST.tif')
print image_to_string(image)

上述代码导致的错误:

Traceback (most recent call last):  
file "./captcha.py", line 52, in <module>  
from tesseract import image_to_string  
ImportError: cannot import name image_to_string

我已经确认安装了tesseract模块:

digital_alchemy@roaming-gnome /home $ pydoc modules | grep 'tesseract'
Hdf5StubImagePlugin _tesseract          gzip                sipconfig
ORBit               cairo               mako                tesseract

我相信我已经抓住了所有必需的套餐但不幸的是我只是陷入了困境。看来该功能不在模块中。

非常感谢任何帮助。

3 个答案:

答案 0 :(得分:7)

对我来说似乎有用的另一种可能性是修改pytesseract,而不是从PIL导入图像导入图像

修改pytesseract后在PyCharm中有效的代码:

from pytesseract import image_to_string
from PIL import Image

im = Image.open(r'C:\Users\<user>\Downloads\dashboard-test.jpeg')
print(im)

print(image_to_string(im))

Pytesseract我通过内置于PyCharm的包管理安装

答案 1 :(得分:1)

您安装的模块的语法是否正确?根据此页面上的用法示例,image_to_string函数看起来像来自PyTesser: https://code.google.com/p/pytesser/

你的导入看起来像是python-tesseract,它列出了一个更复杂的用法示例: https://code.google.com/p/python-tesseract/

答案 2 :(得分:1)

对于Windows,请按照以下步骤操作

pip3 install pytesseract 
pip3 install pillow

还需要安装tessaract-ocr https://github.com/tesseract-ocr/tesseract/wiki 否则,您会收到一条错误消息:Tessract不在路径上

Python代码

from PIL import Image
from pytesseract import image_to_string

print ( image_to_string(Image.open('test.tif'),lang='eng')  )