ocr - 你能用图像而不是文字和字体训练tesseract吗？

你能用图像而不是文字和字体训练tesseract吗？

时间：2018-02-25 05:40:18

标签： ocr tesseract training-data

在tesseract documentation中，解释了使用示例文本和字体进行培训的方法我使用 jTessBoxEditor ，但其工作方式与tesseract培训工具非常相似我得到了一些可接受的结果，但我认为最佳解决方案是训练tesseract，无论如何都必须识别实际类型的图像。
由于我只需要识别数字，我可以手动切割每个数字，也许每个数字的许多版本，并用这些图像训练tesseract，甚至手动设置框。
有没有办法做到这一点？

1 个答案:

答案 0 :(得分：0)

如果您尝试训练tesseract4，则可以使用ocrd-train 您基本上会准备与文本的每一行相对应的图像及其基本事实，它将为您完成所有剩余的工作。

你怎么能用图像复制字体？
在新字体上训练tesseract OCR tess4j
如何训练特定的字体
如何使用图像数据而不是字体文件训练tesseract 4？
如何直接使用* .ttf字体文件来训练tesseract？
你能训练一个带有句子的神经网络而不是用于语音到文本的单词吗？
你能用图像而不是文字和字体训练tesseract吗？
将tesseract训练为一种特定字体
用图像而不是字体训练tesseract 4
如何使用Tesseract训练基于Python的OCR，以训练不同的国民身份证？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？