与--oem 1一起运行时

tesseract --oem 1 1.jpg 1

结果：

Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics

并创建具有相应OCR结果的文件 1.txt 。

与--oem 2一起运行时

tesseract --oem 2 1.jpg 1

结果：

Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

并且不生成任何输出。

我认为该错误将与语言安装有关，但

tesseract --list-langs

这给了我以下结果

List of available languages (2):
eng
osd

我什至手动检查了 tessdata 文件夹，这是同一张屏幕截图

其中明确指出我已经有 eng 语言。

有人可以帮助我解决不允许我使用的确切问题吗？旧版+ LSTM引擎（--oem 2）模式。

Answer 1

是的，您使用的语言是 eng ，但仅支持LSTM。如果您想获得LSTM＆Legacy支持，则需要从tessdata repository

下载数据

与OCR引擎模式配合使用时，Tesseract 4无法加载任何语言-“旧版+ LSTM引擎”（--OEM 2）

与--oem 1一起运行时

与--oem 2一起运行时

1 个答案: