标签: ocr tesseract
我在Windows 7 64位上使用tesseract 3.0.1。我用一种新语言训练图书馆。
我的样本数据间距很大。当我为每个角色的盒子定义坐标时,盒子与角色紧密关系有多重要?我使用其中一个插件,在每个字符上定义粗粒度框,包括一些(或很多)空白区域要快得多。当然,盒子永远不会与其他角色重叠。
答案 0 :(得分:0)
实际上,建议您将空格与实际情况(测试)中的空格相似。然后,使用tesseract-box-editor或jTessBoxEditor,您将能够更正字母框的边界。