未应用Tesseract用户模式

时间:2015-10-30 05:18:33

标签: ocr tesseract tess4j

我想对此图片进行OCR。enter image description here 这是预定义的格式。即前五个将是字符,然后接下来的四个将是数字,最后一个将是字符。

执行以下命令时

$ tesseract in.png stdout

我的输出为 BDVPD474SQ

所以,我去了用户模式。 我创建了一个名为 bazaar 的文件(在目录 / usr / share / tesseract-ocr / tessdata / configs 中)(其内容如下)

load_system_dawg     F
load_freq_dawg       F
user_patterns_suffix user-patterns

我还在目录 / usr / share / tesseract-ocr / tessdata 中创建了一个名为 eng.user-patterns 的文件(其内容如下)< / p>

\A\A\A\A\A\d\d\d\d\A

尽管如此,我得到了相同的结果

$ tesseract in.png stdout bazaar
BDVPD474SQ

我做错了什么? Tess4j有没有人完成这个?

0 个答案:

没有答案