我想对此图片进行OCR。 这是预定义的格式。即前五个将是字符,然后接下来的四个将是数字,最后一个将是字符。
执行以下命令时
$ tesseract in.png stdout
我的输出为 BDVPD474SQ
所以,我去了用户模式。 我创建了一个名为 bazaar 的文件(在目录 / usr / share / tesseract-ocr / tessdata / configs 中)(其内容如下)
load_system_dawg F
load_freq_dawg F
user_patterns_suffix user-patterns
我还在目录 / usr / share / tesseract-ocr / tessdata 中创建了一个名为 eng.user-patterns 的文件(其内容如下)< / p>
\A\A\A\A\A\d\d\d\d\A
尽管如此,我得到了相同的结果
$ tesseract in.png stdout bazaar
BDVPD474SQ
我做错了什么? Tess4j有没有人完成这个?