我已经成功创建了一个带有tesseract的盒子文件 现在运行unicharset_extractor后 让它创建看起来像这样的unicharset文件:
...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...
我继续使用此命令
mftraining -U unicharset -O testlang.unicharset testlang.tr
仅获取下一个错误
Reading testlang.tr ...
testlang has no defined properties.
Error: Illegal short name for a feature!
答案 0 :(得分:0)
我从未使用过Tesseract,但似乎bug数据库中存在一个与您的问题非常相似的问题:http://code.google.com/p/tesseract-ocr/issues/detail?id=385
似乎它与某些功能无法正确支持的科学记数法有关。
在问题页面上,用户建议一个解决方案,另一个提出补丁。您可以尝试应用补丁以查看它是否有帮助。