Tesseract新字体培训失败

时间:2019-11-16 10:27:13

标签: tesseract python-tesseract

我正在将Tesseract库用于OCR项目,我需要识别一种新字体。我已经按照本教程on youtube进行了操作,并添加了新的字体,即在波斯语中流行的'B Nazanin'。但是我遇到了以下错误:

=== Starting training for language 'fas'
[‫شنبه ۱۶ نوامبر ۱۹، ساعت ۱۳:۳۴:۲۶ (+0330)‬] /usr/bin/text2image --fonts_dir=fonts --font=B Nazanin --outputbase=/tmp/font_tmp.0dLuk6X9KA/sample_text.txt --text=/tmp/font_tmp.0dLuk6X9KA/sample_text.txt --fontconfig_tmpdir=/tmp/font_tmp.0dLuk6X9KA
Stripped 1 unrenderable words
Error in boxaGetExtent: boxa not defined
Error in boxaAddBox: box not defined
Rendered page 0 to file /tmp/font_tmp.0dLuk6X9KA/sample_text.txt.tif
Rtl = 0 ,vertical=0

=== Phase I: Generating training images ===
Rendering using B Nazanin
[‫شنبه ۱۶ نوامبر ۱۹، ساعت ۱۳:۳۴:۲۷ (+0330)‬] /usr/bin/text2image --fontconfig_tmpdir=/tmp/font_tmp.0dLuk6X9KA --fonts_dir=fonts --strip_unrenderable_words --leading=32 --xsize=3600 --char_spacing=0.0 --exposure=0 --outputbase=/tmp/fas-2019-11-16.Upk/fas.B_Nazanin.exp0 --max_pages=10 --font=B Nazanin --text=../langdata_lstm/fas/fas.training_text
ERROR: Non-existent flag --max_pages=10
ERROR: Program text2image failed. Abort.

我搜索了此错误,但没有成功。 max_pages参数设置正确,但是没有理由不创建Box文件。 错误是什么,怎么解决? 感谢您的帮助。

0 个答案:

没有答案