在单词级边界框

时间:2017-08-14 13:39:57

标签: c++ ocr tesseract lstm

我想在我自己的包含单词图像的数据集上训练Tesseract。我有边界框信息但是对于整个单词而不是每个字符。我参考了有关Tesseract 4.0培训主题的以下文档。 https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00

在文档中,提到“这些框只需要处于文本行级别。因此,从现有图像数据中制作训练数据要容易得多。”但是后来在wiki中,允许文本行级别的框格式表示尚未实现(“Box文件格式 - 第二选项(未实现)”)。因此,我想知道是否有任何方法可以根据单词边界框信息而不是字符级别信息来训练Tesseract?

0 个答案:

没有答案