如何使Tesseract像pythonic模块一样工作

时间:2018-11-15 11:00:06

标签: python tesseract

当我将pytesseract放置在与执行的python脚本相同的文件夹中时,为什么不能导入pytesseract?至少这就是其他python模块为我工作的方式。

我很感谢一个没有安装pipapt-get或设置路径的解决方案,因为我正在为初学者级Windows用户开发软件。在他的系统上复制主文件夹并安装python3之后,如果它能正常工作,那将是最好的选择。

代码:

import pytesseract
import cv2


img = '/home/artur/Desktop/test_images/frame_0000.png'
string = pytesseract.image_to_string(cv2.imread(img))
print(string)

输出:

Traceback (most recent call last):
  File "/home/artur/Desktop/OCR/Pytesseract_test.py", line 6, in <module>
    string = pytesseract.image_to_string(cv2.imread(img))
  File "/home/artur/Desktop/OCR/pytesseract.py", line 294, in image_to_string
    return run_and_get_output(*args)
  File "/home/artur/Desktop/OCR/pytesseract.py", line 202, in run_and_get_output
    run_tesseract(**kwargs)
  File "/home/artur/Desktop/OCR/pytesseract.py", line 172, in run_tesseract
    raise TesseractNotFoundError()
pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

1 个答案:

答案 0 :(得分:0)

首先,您需要在Windows上以软件/应用程序(而非模块)的形式安装teserract。这是下载tesseract的链接。   https://github.com/UB-Mannheim/tesseract/wiki

此外,您需要在代码C:\Program Files\Tesseract-OCR\tesseract.exe中指定tesseract.exe文件的安装路径。它可能对您来说是不同的安装路径,所以请检查一下。以下代码对我有用:

from PIL import Image
from pytesseract import image_to_string
import pytesseract

#following line of code indicates installation files path. it may be different for you  
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(Image.open("text.png"))
print(text)