设置字体属性文件以训练tesseract v 3.01 ocr引擎时遇到问题。根据3.01v,您需要设置字体属性文件。 font_properties文件的格式是
并且必须使用0或1标志来指示属性。有没有人知道固定,serif或fraktur是什么意思?
当我使用我的font_properties文件运行它时会抛出以下错误
谢谢
答案 0 :(得分:1)
固定(或等宽),Serif和Fraktur是标准字体描述符 - 您可以在维基百科上查找它们的含义。
关于您的错误,请确保您已正确格式化了font_properties文件,如下面的Training Tesseract 3教程中所述。如果您只训练一种字体,则该文件应包含一行,在您的情况下
times_new_roman 0 0 0 1 0
您尚未在font_properties文件中添加内容,但请注意您的字体名称不应包含空格!
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
答案 1 :(得分:1)
Tesseract培训的输入文件名称中不应有空格。
font_properties中的条目应与图像文件名称的fontname部分匹配;例如,如果font_properties具有uknumberplate,那么图像的文件名应为eng.uknumberplate.exp0.tif。
答案 2 :(得分:0)
你必须在命令中放置font_properties.txt,但是在Windows中抛出异常,但它会找到字体属性文件。