训练tesseract时正确的间距

时间:2012-05-27 00:13:55

标签: ocr tesseract

我在Windows 7 64位上使用tesseract 3.0.1。我用一种新语言训练图书馆。

我的样本数据间距很大。当我为每个角色的盒子定义坐标时,盒子与角色紧密关系有多重要?我使用其中一个插件,在每个字符上定义粗粒度框,包括一些(或很多)空白区域要快得多。当然,盒子永远不会与其他角色重叠。

1 个答案:

答案 0 :(得分:0)

实际上,建议您将空格与实际情况(测试)中的空格相似。然后,使用tesseract-box-editorjTessBoxEditor,您将能够更正字母框的边界。