我正在尝试使用Tesseract来识别记录蚀刻中的文本,例如:
Tesseract command line documentation建议可以通过传递--oem标志来指定“ OCR引擎模式”。 OCR引擎模式1是“神经网络LSTM”,听起来很有希望。但是,当我尝试使用以下命令调用该模型时:
tesseract etching.png stdout --oem 1
我得到了这个堆栈跟踪:
Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/local/Cellar/tesseract/3.05.01/share/tessdata/eng.cube.lm
Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object
init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 210
Abort trap: 6
如果我放下--oem
标志,我将得到输出(但这是无稽之谈)。有谁知道如何解释此消息,或者我可以做些什么来利用LSTM模型?我正在使用OSX ...