我最近使用了tesseract OCR和python,当我尝试从tesseract导入image_to_string
时,我一直收到错误。
导致问题的代码:
# Perform OCR using tesseract-ocr library
from tesseract import image_to_string
image = Image.open('input-NEAREST.tif')
print image_to_string(image)
上述代码导致的错误:
Traceback (most recent call last):
file "./captcha.py", line 52, in <module>
from tesseract import image_to_string
ImportError: cannot import name image_to_string
我已经确认安装了tesseract模块:
digital_alchemy@roaming-gnome /home $ pydoc modules | grep 'tesseract'
Hdf5StubImagePlugin _tesseract gzip sipconfig
ORBit cairo mako tesseract
我相信我已经抓住了所有必需的套餐但不幸的是我只是陷入了困境。看来该功能不在模块中。
非常感谢任何帮助。
答案 0 :(得分:7)
对我来说似乎有用的另一种可能性是修改pytesseract,而不是从PIL导入图像导入图像
修改pytesseract后在PyCharm中有效的代码:
from pytesseract import image_to_string
from PIL import Image
im = Image.open(r'C:\Users\<user>\Downloads\dashboard-test.jpeg')
print(im)
print(image_to_string(im))
Pytesseract我通过内置于PyCharm的包管理安装
答案 1 :(得分:1)
您安装的模块的语法是否正确?根据此页面上的用法示例,image_to_string
函数看起来像来自PyTesser:
https://code.google.com/p/pytesser/
你的导入看起来像是python-tesseract,它列出了一个更复杂的用法示例: https://code.google.com/p/python-tesseract/
答案 2 :(得分:1)
对于Windows,请按照以下步骤操作
pip3 install pytesseract
pip3 install pillow
还需要安装tessaract-ocr https://github.com/tesseract-ocr/tesseract/wiki 否则,您会收到一条错误消息:Tessract不在路径上
Python代码
from PIL import Image
from pytesseract import image_to_string
print ( image_to_string(Image.open('test.tif'),lang='eng') )