如何在colab中使用pytesseract从图像中提取文本?

时间:2021-05-09 06:13:14

标签: python ocr google-colaboratory

当我尝试在 colab 中使用 pytesseract 时出现此错误。

我不知道如何解决这个问题。我也用 pip install tesseract 安装。但它不起作用。

有谁知道如何解决这个问题? 或者你有其他python库OCR吗?

FileNotFoundError: [Errno 2] No such file or directory: 'tesseract': 'tesseract'

During handling of the above exception, another exception occurred:

TesseractNotFoundError                    Traceback (most recent call last)
/usr/local/lib/python3.7/dist-packages/pytesseract/pytesseract.py in run_tesseract(input_filename, output_filename_base, extension, lang, config, nice, timeout)
    257         if e.errno != ENOENT:
    258             raise e
--> 259         raise TesseractNotFoundError()
    260 
    261     with timeout_manager(proc, timeout) as error_string:

TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

这是我的代码。我正在尝试检测号码。

import pytesseract
roi = img[ymin:ymax, xmin:xmax]
text = pytesseract.image_to_string(roi, lang='eng')

1 个答案:

答案 0 :(得分:0)

如果未安装 pytesseract,此代码将在 colab 中工作。

!sudo apt install tesseract-ocr
!pip install pytesseract
import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open('/path'))
print(text)
相关问题