图像到文本使用tesseract和pytesseract的Python 3.6错误

时间:2018-04-18 20:02:14

标签: python python-3.x windows-7 tesseract

我正在尝试使用pytesseract中的image_to_string函数,但无法做到这一点。 我已经安装了pytesseract模块和tesseract模块,但最后一个似乎不起作用,我有以下代码

import argparse
import cv2
import os
import time
import sys
from PIL import Image
import pytesseract
A=Image.open("C:/Users/Martin/Python/Python36/Tickets/2.jpg")
pytesseract.image_to_string(A)

当我运行此操作时,我收到以下错误消息

Traceback (most recent call last):
  File "C:/Users/Martin/Python/Python36/cosa.py", line 9, in <module>
    pytesseract.image_to_string(A)
  File "C:\Users\Martin\Python\Python36\lib\site-packages\pytesseract\pytesseract.py", line 193, in image_to_string
    return run_and_get_output(image, 'txt', lang, config, nice)
  File "C:\Users\Martin\Python\Python36\lib\site-packages\pytesseract\pytesseract.py", line 140, in run_and_get_output
    run_tesseract(**kwargs)
  File "C:\Users\Martin\Python\Python36\lib\site-packages\pytesseract\pytesseract.py", line 111, in run_tesseract
    proc = subprocess.Popen(command, stderr=subprocess.PIPE)
  File "C:\Users\Martin\Python\Python36\lib\subprocess.py", line 709, in __init__
    restore_signals, start_new_session)
  File "C:\Users\Martin\Python\Python36\lib\subprocess.py", line 997, in _execute_child
    startupinfo)
FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado

所以我尝试运行import tesseract,这显示

Traceback (most recent call last):
  File "<pyshell#53>", line 1, in <module>
    import tesseract
  File "C:\Users\Martin\Python\Python36\lib\site-packages\tesseract\__init__.py", line 34
    print 'Creating user config file: {}'.format(_config_file_usr)
                                    ^
SyntaxError: invalid syntax

我想这是一个兼容性问题(我正在使用Python 3.6.5并且打印现在是一个函数所以()是预期的)但是当我运行pip install --upgrade tesseract我得到它已经是最新的所以我不知道如何使这项工作。我正在使用Windows 7 64位。 任何帮助非常感谢。

3 个答案:

答案 0 :(得分:1)

在您的系统中,没有安装Tesseract。

您使用tesseract安装的软件包pipanother Python package,与Tesseract OCR引擎无关。

您必须按照this说明安装Tesseract。然后,您可以使用pytesseract

答案 1 :(得分:0)

不能完全确定这是否可以解决您的问题,因为它是Windows,并且错误不是英语,但对于其他Google员工,如果您遇到

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

ocr需要与pip的python软件包分开安装:

sudo apt install tesseract-ocr

将其安装到您的路径中。

答案 2 :(得分:0)

ocr需要与pip的python软件包分开安装:

sudo apt install tesseract-ocr