在Windows中安装Tesseract

时间:2017-09-10 12:00:43

标签: python opencv python-tesseract

我目前正在使用python 2.7进行最佳字符识别项目,在windows中打开计算机视觉。为了完成这项任务,我发现它可以通过使用tesseract(软件)完成。但是,它无法安装在Windows上。我搜索了很多,但我无法得到解决方案。任何人都可以告诉我有没有办法在Windows上安装它?还是可以在不使用它的情况下完成?

3 个答案:

答案 0 :(得分:0)

UB Mannheim为最新版本的tesseract提供预先构建的二进制文件。

来自tesseract Github wiki

  

     

适用于Tesseract 3.05-dev和Windows的Windows的非官方安装程序   Tesseract 4.00-dev可从Tesseract at UB Mannheim获得。这个   包括培训工具。

     

...

     

要从任何位置访问tesseract-OCR,您可能需要添加   tesseract-OCR二进制文件到Path的目录   变量,可能是C:\Program Files\Tesseract-OCR

答案 1 :(得分:0)

在Windows中安装tesseract的简单步骤。

  1. https://github.com/UB-Mannheim/tesseract/wiki下载pesseract exe

  2. 在C:\ Program Files(x86)\ Tesseract- OCR中安装此exe

  3. 在Windows或anaconda提示符下打开虚拟机命令提示符。

  4. 运行pip install tesseract

  5. 要测试是否已安装tesseract,请在python提示符下输入

    导入pytesseract

    print(pytesseract)

答案 2 :(得分:0)

要在 Windows 上使用 Python 完成 OCR,您将需要已有的 Python 和 OpenCV,以及 Tesseract 和 Pytesseract Python 包。

要为 Windows 安装 Tesseract OCR:

  1. 从 UB Mannheim 运行 installer
  2. 配置您的安装(选择要包含的安装路径和语言数据)
  3. 将 Tesseract OCR 添加到您的环境变量中

在 Windows 上安装和使用 Pytesseract:

  1. 只需运行 pip install pytesseract
  2. 您还需要安装 Pillowpip install Pillow 才能使用 Pytesseract。像这样 from PIL import Image.
  3. 将它导入到您的 Python 文档中
  4. 您需要在代码中添加以下行,以便能够在您的机器上调用 pytesseract:pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

如果您需要进一步指导,我已经详细介绍了如何为 Windows here 安装 Tesseract OCR。