标签: ocr tesseract
例如:A1234567
我想将第一个字符定义为仅字母,其余为数字。
如何使用tesseract做到这一点?
答案 0 :(得分:0)
看起来你想要的东西相当于使用来自' A-Z0000000'的单词 。到' A-Z9999999'。不幸的是,似乎tesseract不支持单词白名单,至少根据this问题。
如果我是你,我会这样做:用字母和数字运行tesseract,丢弃不以字母开头的字或者以字母开头后有任何非数字字符。
答案 1 :(得分:0)
尝试bazaar匹配模式。
\c\d\d\d\d\d\d\d