在训练Tesseract-OCR V 3.01时出现Font_Property问题

时间:2012-07-24 09:35:52

标签: image-processing ocr tesseract tessnet2

设置字体属性文件以训练tesseract v 3.01 ocr引擎时遇到问题。根据3.01v,您需要设置字体属性文件。 font_properties文件的格式是

并且必须使用0或1标志来指示属性。有没有人知道固定,serif或fraktur是什么意思?

当我使用我的font_properties文件运行它时会抛出以下错误enter image description here]![enter image description here

谢谢

3 个答案:

答案 0 :(得分:1)

固定(或等宽),Serif和Fraktur是标准字体描述符 - 您可以在维基百科上查找它们的含义。

关于您的错误,请确保您已正确格式化了font_properties文件,如下面的Training Tesseract 3教程中所述。如果您只训练一种字体,则该文件应包含一行,在您的情况下

times_new_roman 0 0 0 1 0

您尚未在font_properties文件中添加内容,但请注意您的字体名称不应包含空格!

http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

答案 1 :(得分:1)

Tesseract培训的输入文件名称中不应有空格。

font_properties中的条目应与图像文件名称的fontname部分匹配;例如,如果font_properties具有uknumberplate,那么图像的文件名应为eng.uknumberplate.exp0.tif。

答案 2 :(得分:0)

你必须在命令中放置font_properties.txt,但是在Windows中抛出异常,但它会找到字体属性文件。