Tesseract:使用长期短时记忆会引发“无法读取多维数据集语言模型”

时间:2018-06-22 15:39:57

标签: c++ tesseract

我正在尝试使用Tesseract来识别记录蚀刻中的文本,例如:

enter image description here

Tesseract command line documentation建议可以通过传递--oem标志来指定“ OCR引擎模式”。 OCR引擎模式1是“神经网络LSTM”,听起来很有希望。但是,当我尝试使用以下命令调用该模型时:

tesseract etching.png stdout --oem 1

我得到了这个堆栈跟踪:

Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/local/Cellar/tesseract/3.05.01/share/tessdata/eng.cube.lm
Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object
init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 210
Abort trap: 6

如果我放下--oem标志,我将得到输出(但这是无稽之谈)。有谁知道如何解释此消息,或者我可以做些什么来利用LSTM模型?我正在使用OSX ...

0 个答案:

没有答案