应用错误收集

Tesseract OCR发现太少的盒子/忽略小字符

时间：2015-04-01 15:00:13

标签： ocr tesseract

使用Tesseract进行培训/文本识别过程时遇到问题。这是我的训练数据：http://s11.postimg.org/867aq10ur/dot_dotmatrixfont_exp0.png虽然训练Tesseract忽略破折号（我用红色框标记它们，只是为了清楚我的意思）和如果我使用经过训练的数据文本识别它也忽略了它们。今天我玩了Tesseract参数（SetVariable（名称，值）），但不幸的是我没有成功。我能做些什么来教Tesseract那些破折号？提前谢谢！

1 个答案:

答案 0 :(得分：0)

Tesserect培训非常棘手。

你最好的机会可能是将破折号作为单个字符处理。如果你的盒子编辑器或你正在使用的任何工具都没有看到破折号，请先尝试运行一些图像处理，尤其是阈值或反转。试着看看OpenCV。他们有一些很好的工具用于这种图像处理。

限制字符tesseract正在寻找
Tesseract无法识别单个字符
如何避免Tesseract将小行识别为数字或字母？
Tesseract OCR发现太少的盒子/忽略小字符
tesseract 4（HEAD-ae53ed6）忽略我的配置文件
通过删除特殊字符来改进Tesseract OCR结果
使用tesseract ocr
Tesseract将表格边框作为字符读取
Tesseract / OCR返回相同字母的不同边界框
tesseract 4.0.0-beta.1

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？