当我将pytesseract放置在与执行的python脚本相同的文件夹中时,为什么不能导入pytesseract?至少这就是其他python模块为我工作的方式。
我很感谢一个没有安装pip
或apt-get
或设置路径的解决方案,因为我正在为初学者级Windows用户开发软件。在他的系统上复制主文件夹并安装python3之后,如果它能正常工作,那将是最好的选择。
代码:
import pytesseract
import cv2
img = '/home/artur/Desktop/test_images/frame_0000.png'
string = pytesseract.image_to_string(cv2.imread(img))
print(string)
输出:
Traceback (most recent call last):
File "/home/artur/Desktop/OCR/Pytesseract_test.py", line 6, in <module>
string = pytesseract.image_to_string(cv2.imread(img))
File "/home/artur/Desktop/OCR/pytesseract.py", line 294, in image_to_string
return run_and_get_output(*args)
File "/home/artur/Desktop/OCR/pytesseract.py", line 202, in run_and_get_output
run_tesseract(**kwargs)
File "/home/artur/Desktop/OCR/pytesseract.py", line 172, in run_tesseract
raise TesseractNotFoundError()
pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
答案 0 :(得分:0)
首先,您需要在Windows上以软件/应用程序(而非模块)的形式安装teserract。这是下载tesseract的链接。 https://github.com/UB-Mannheim/tesseract/wiki
此外,您需要在代码C:\Program Files\Tesseract-OCR\tesseract.exe
中指定tesseract.exe文件的安装路径。它可能对您来说是不同的安装路径,所以请检查一下。以下代码对我有用:
from PIL import Image
from pytesseract import image_to_string
import pytesseract
#following line of code indicates installation files path. it may be different for you
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(Image.open("text.png"))
print(text)