应用错误收集

合并两个OCR训练数据

时间：2012-02-19 15:22:17

标签： java linux ocr

我正在尝试识别图像（表单）并转换为文本，目前使用来自Google“tesseract-ocr”的egg.trained数据，这适用于打印字符和手动编写的（手动编写）我开发了训练有素的数据，这对于我训练的角色来说效果很好。我想合并这两个经过训练的数据（tesseract-ocr +我自己训练的数据），这样我就可以识别单个形式的手写和打印字符，请告诉我如何将这两个文件合并为一个。

1 个答案:

答案 0 :(得分：5)

无需合并它们。 Tesseract 3.02支持识别多种语言 - 例如，您可以指定“egg + eng + blah”作为-l选项的值。

合并两个OCR训练数据
合并训练有素的数据文件 - Tesseract
tesseract - 代码的训练数据
OCR通过合并两个相同数据字符串来清理数据
OCR tesseract：针对特殊字体的训练数据创建问题（使用Jtessboxeditor）
在Tesseract的情况下，没有配置和训练有素的数据文件
使用经过训练的数据验证ios
如何使用pytesseract训练的数据？
在MATLAB中访问OCR训练语言数据的路径错误
将英语与受过方程训练的数据一起使用tesseract tess4j

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？