应用错误收集

我可以将Tesseract配置为仅检测单个字母和数字吗？

时间：2016-01-05 19:49:47

标签： ocr tesseract

我尝试使用Tesseract ocr处理具有以下矩阵的特定卡片： matrix of numbers

有没有办法配置Tesseract只提取单个字母？

问题是矩阵的列有字母作为标题：＆＃34; A B C D E F G H I＆＃34;当我使用BOX文件训练时，每个字母都被检测到，但是当我执行ocr过程时，字母被合并成一个单词：＆＃34; ABCDEFGHI＆＃34;。我需要将单词分开，因为我需要每列的边界（x，y，高度，宽度），这样可以使整个列的处理更加准确。

谢谢，

1 个答案:

答案 0 :(得分：1)

如果您可以将间距增加到足够大，则Tesseract可以在设置变量preserve_interword_spaces=1后获取间距（请参阅doc）。

python-tesseract OCR：仅获取数字
Java OCR检测数独网格数字
我可以将Tesseract配置为仅使用指定长度识别图像中的文本吗？
为什么pytesseract不能识别单个数字？
强制Tesseract仅识别数字
我可以将Tesseract配置为仅检测单个字母和数字吗？
Tessnet2 OCR：如何调整OCR以仅识别所有字母，单词和数字？
tesseract只检测一个阿拉伯语单词（而不是28个字符）和数字
我想安装Tesseract和./configure
训练Haar分类器以检测字母/数字

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？