如何使用Tesseract识别为每个角色定义数字或字母?

时间:2014-12-10 08:12:41

标签: ocr tesseract

例如:A1234567

我想将第一个字符定义为仅字母,其余为数字。

如何使用tesseract做到这一点?

2 个答案:

答案 0 :(得分:0)

看起来你想要的东西相当于使用来自' A-Z0000000'的单词 。到' A-Z9999999'。不幸的是,似乎tesseract不支持单词白名单,至少根据this问题。

如果我是你,我会这样做:用字母和数字运行tesseract,丢弃不以字母开头的字或者以字母开头后有任何非数字字符。

答案 1 :(得分:0)

尝试bazaar匹配模式。

\c\d\d\d\d\d\d\d