使用Pytesser时出错:** [WinError 2]系统找不到指定的文件**

时间:2015-07-04 06:27:57

标签: python pytesser

我收到此错误: [WinError 2]系统找不到指定的文件,只有当我使用pytesser进行OCR时。这是我的代码段。

from PIL import Image
from pytesseract import *
image = Image.open('pranav.jpg')
print (image_to_string(image))****

否则,当我使用PIL更改图像大小时,我不会收到此错误。

6 个答案:

答案 0 :(得分:9)

您不必编辑任何pytesseract文件。您可以在代码中声明Tesseract安装的路径,如下所示:

import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

答案 1 :(得分:3)

我得到了同样的错误。你必须从这里安装tesseract: https://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&

然后你必须编辑pytesseract.py文件。 在我的例子中,这个文件位于文件夹:

  

C:\ Users \用户名\应用程序数据\漫游\ Python34 \站点包\ pytesseract \ pytesseract.py

搜索以下行(对我而言,第60行):

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

并将其更改为pytesseract.exe所在的位置,在我的情况下,该行如下所示:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'c:\\Program Files (x86)\\Tesseract-OCR\\tesseract'

现在你的代码应该可以工作了。

答案 2 :(得分:1)

在环境变量中添加tesseract路径。

至少我是如何修理的。

答案 3 :(得分:0)

  1. 您可以从这里下载tesseract: https://github.com/UB-Mannheim/tesseract/wiki

    最新的安装程序可以在这里下载:tesseract-ocr-setup-3.05.01.exe 和tesseract-ocr-setup-4.0.0-alpha.20180109.exe(实验性的)。有 还提供旧版本。

  2. 编辑你的pytesseract.py 例如。 C:\ Users \用户USER \ Anaconda3 \ LIB \站点包\ pytesseract.py

    如果TESSERACT不在您的路径中,或者被命名为不同,则更改此权利 tesseract_cmd =' c:\ Program Files(x86)\ Tesseract-OCR \ tesseract'

  3. 在导入pytesseract

    后在代码中添加以下语句

    pytesseract.pytesseract.tesseract_cmd =' c:\ Program Files(x86)\ Tesseract-OCR \ tesseract'

答案 4 :(得分:0)

设置tesseract_cmd,pytesseract.pytesseract.tesseract_cmd,TESSDATA_PREFIX和tessdata_dir_config,如下所示:

from PIL import Image
import pytesseract
tesseract_cmd = 'D:\\Softwares\\Tesseract-OCR\\tesseract'
pytesseract.pytesseract.tesseract_cmd = 'D:\\Softwares\\Tesseract-OCR\\tesseract'
TESSDATA_PREFIX= 'D:\Softwares\Tesseract-OCR'
tessdata_dir_config = '--tessdata-dir "D:\\Softwares\\Tesseract-OCR\\tessdata"'
print(pytesseract.image_to_string( Image.open('D:\\ImageProcessing\\f2.jpg'), lang='eng', config=tessdata_dir_config))

答案 5 :(得分:0)

要完全摆脱错误,请执行以下任务:

  1. 下载tesseract(32位| 64位)
  2. 将其安装在系统中,并记下路径。
  3. 创建环境变量{tesseract =“安装路径/tesseract.exe”}
  4. 重新启动内核
  5. 使用以下代码:
docroot