应用错误收集

如何用三种不同的笔迹训练相同数字的tesseract-ocr？

时间：2016-12-01 07:53:15

标签： java ocr tesseract

我在java中创建了一个程序，它从扫描的tiff图像中读取字符，但准确性不是那么好。

如果我们更改文档中的手写内容，则结果会略有不同。那么有没有训练tesseract-ocr的方法？

我也使用了jtessEditorBox但没有任何帮助。

1 个答案:

答案 0 :(得分：0)

我建议你挖这个帖子： http://www.tuxrincon.com/blog/training-tesseract-ocr/

获取每个手写的图片。在几张图片上使用“QT Box Editor”将字符与字符相关联。然后给他们tesseract，以便使用“train.sh”脚本训练它（可以纠正它中的一些错误）。我没有使用“train2.sh”，因为在我的情况下它似乎适得其反。将所有handwritings traineddata文件添加到tesseract配置文件。您可以更改“QT Box Editor”配置以使用其他语言设置手写内容。

训练Tesseract特定单词 - 可能吗？
火车tesseract停止工作
培训Tesseract 3.02的最佳方法
为印地语训练tesseract
Tesseract-OCR：需要培训所有类型的样品吗？
如何用三种不同的笔迹训练相同数字的tesseract-ocr？
如何转换/匹配手写的名单？（HWR）
将tesseract训练为一种特定字体
训练tesseract 3.04

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？