我试图训练tesseract,因为它主要混淆" g"用" 9"在阅读我的.tiff文件时。
在推断出.tiff文件中使用的字体似乎是" Pragmatica Book"之后,我决定按照this tutorial来训练我的tesseract用Pragmatica字体中的常用字符。
关于命令,问题是:
shapeclustering -F font_properties -U unicharset eng2.LobsterTwo.exp0.tr
它给出了:
索引n的错误属性,字符A:0,255 0,255 0,0 0,0 0,0
n从3到64,
以及
的多行计算形状距离...
停止,0合并,min dist 999.000000
这将导致下一步:
索引n的错误属性,字符:0,255 0,255 0,0 0,0 0,0
表示n从3到64,然后是
警告:在CreateIntTemplates()
中没有sh0058的原型/配置
我发现this former post处理了这个问题,但是所有相关的答案都提到了.tr文件和font_properties中字体名称不同的事实,这不是我的情况,因为这两个名字都是&#34 ; Pragmatica"
在此先感谢您的帮助,我不知道我做错了什么!