我正在尝试在anaconda提示符中安装Pytesseract-OCR包,我面临以下问题。 以下是我遵循的步骤
pip install pillow
pip install pytesseract
然后我从https://github.com/UB-Mannheim/tesseract/wiki下载pytesseract-ocr并将其安装到F:目录
当我尝试在我的Jupyter笔记本中运行python代码时如下:
from PIL import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'F:\Tesseract-OCR\tesseract.exe'
im=Image.open(r"G:\Downloads From Chrome\myimg.jpg")
result=pytesseract.image_to_string(im)
抛出以下错误
FileNotFoundError: [WinError 2] The system cannot find the file specified
请帮我解决这个问题 提前谢谢
感谢您解决上述问题 我尝试了但它导致了另一个问题
(1, 'Error opening data file F:\\Tesseract-OCR\\tessdata/english.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language \'english\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
我还在我的系统环境变量中将路径F:\ Tesseract-OCR \ tessdata设置为TESSDATA_PREFIX并重新启动,但即使这样它也无法正常工作。我在上面提到的目录中有所有英文文件
答案 0 :(得分:2)
您还需要在路径中使用原始r""
字符串。
pytesseract.pytesseract.tesseract_cmd = r'F:\Tesseract-OCR\tesseract.exe'
否则,\t
被解释为制表符,F:\Tesseract-OCR esseract.exe
肯定不存在:)