Tesseract OCR培训给出了'APPLY_BOXES'错误

时间:2012-11-15 09:42:33

标签: ocr tesseract

我正在训练Tesseract 3 for digital-7字体,我在输出中遇到一些错误(来自stderr):

APPLY_BOXES: boxfile line 35/I ((735,7860),(737,7890)): FAILURE! Couldn't find a matching blob

APPLY_BOXES: Unlabelled word at :Bounding box=(7523,-910)->(7549,-906)

他们是什么意思?

我正在使用的命令行是:

tesseract eng.digital-7.exp0.tif eng.digital-7.exp0 nobatch box.train

1 个答案:

答案 0 :(得分:3)

仔细检查你的.tif文件字符间距:第一个错误可能是由于两个字符太靠近而导致产生一个单独的边界框(另请参阅此thread)。

我想,第二个错误是第一个错误的结果。