使用Anaconda / Jupyter的TesseractNotFoundError

时间:2019-02-13 14:43:36

标签: python python-tesseract

我已经安装了Anaconda 2018.12(Python 3.7版本)。我正在尝试测试pytesseract模块,但是我一直遇到:

TesseractNotFoundError:C:\ Program Files(x86)\ Tesseract-OCR \ tesseract.exe未安装或不在您的路径中

我已经完成:

  • pip install Pillow(已经安装并显示)
  • pip install pytesseract(成功)
  • 试图将tesseract_cmd设置为tesseract的位置(但找不到)

我已经搜索了tesseract.exe文件,但是无法在系统上的任何位置找到它,因此,我很难理解如果模块已经被消耗在anaconda中,如何将其引用/导入到jupyter笔记本中?

我要运行的代码是:

from PIL import Image 
import pytesseract
#pytesseract.pytesseract.tesseract_cmd = r"C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"

text = pytesseract.image_to_string(Image.open('C:\Temp\IMG_1519.jpg'))

print(text)

我希望这是简单的用户错误,但将不胜感激地收到任何帮助。非常感谢,本

1 个答案:

答案 0 :(得分:0)

PyPi页报价:

  

Python-tesseract是Google Tesseract-OCR引擎的包装。

和(根据条件):

  

安装Google Tesseract OCR(有关如何在Linux,Mac OSX和Windows上安装引擎的其他信息)

这意味着pytesseract不是独立的模块。这是使用Google’s Tesseract-OCR Engine的python包装器,您需要单独安装