我认为此问题仅与带有LSTM支持的Tesseract 4有关。当我使用64位Windows系统时,我已经从此处下载了64-bit windows executable-https://github.com/UB-Mannheim/tesseract/wiki
它具有以下OCR引擎模式:
它可用于除 2 以外的所有模式。
tesseract --oem 1 1.jpg 1
结果:
Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics
并创建具有相应OCR结果的文件 1.txt 。
tesseract --oem 2 1.jpg 1
结果:
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
并且不生成任何输出。
我认为该错误将与语言安装有关,但
tesseract --list-langs
这给了我以下结果
List of available languages (2):
eng
osd
我什至手动检查了 tessdata 文件夹,这是同一张屏幕截图
其中明确指出我已经有 eng 语言。
有人可以帮助我解决不允许我使用的确切问题吗? 旧版+ LSTM引擎(--oem 2)模式。