在脚本中运行pytesseract的问题

时间:2018-03-09 22:35:53

标签: python tesseract valueerror python-tesseract

我正在尝试在我的python脚本中使用pytesseract来读出图像中的一串文本,但我不断收到错误。我现在正在尝试这段代码:

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files 
(x86)\\Tesseract-OCR\\tesseract'
# Include the above line, if you don't have tesseract executable in 
#your PATH
# Example tesseract_cmd: 'C:\\Program Files (x86)\\Tesseract-
#OCR\\tesseract'

# Simple image to string
print(pytesseract.image_to_string(Image.open('IMG_9296.jpg')))

IMG_9296.jpg文件位于我的桌面上:~/Desktop。我已经安装了tesseract和pytesseract,因为在我的命令行中键入tesseract会返回有关它的信息。 当我在命令行中输入pip install pytesseract时,我会回来:

Requirement already satisfied: pytesseract in /Library/Python/2.7/site-packages
Requirement already satisfied: Pillow in /Library/Python/2.7/site-packages (from pytesseract)

所以我猜测/Library/Python/2.7/site-packages是我的pytesseract路径,所以我尝试将其放入pytesseract.pytesseract.tesseract_cmd,但这不起作用。无论哪种方式,我都会收到此错误(我想从import pytesseract行):

ValueError: Attempted relative import in non-package

我是否需要进入不同的路径,或者在某处移动/复制pytesseract?我不确定发生了什么。

1 个答案:

答案 0 :(得分:0)

首先通过输入代码来检查命令提示符

!pip view pytesseract

如果它返回一些信息,意味着您已将其包含在系统中,则还需要查看PIL模块。

现在进入您的主要问题


为了进行pytesseact,您需要位于 pytesseract.pytesseract.tesseract_cmd 路径上:-
而且,您还需要位于图像所在的路径上。
因此,您可以做的如下所示

导入pytesseract
导入cv2

导入操作系统 os.chdir(位于“ FullPath_where_your_“ tesseract.exe”)

图片= cv2.imread('full_path_of_your_image')
pytext = pytesseract.image_to_string(image)
打印(pytext)


如果不起作用请通知我

学习愉快!