pytesseract不使用用户词

时间:2019-06-28 19:31:26

标签: tesseract python-tesseract

我正在尝试使用这种格式的已创建的“集市”配置文件(我尝试设置T和F):

Item pencil = new Item("Pencil", 0.23, 50);
pencil.showInvoiceInfo();

我正在使用Latin.traineddata语言,并在同一目录/ tessdata中创建了Latin.user-words 用一些词,例如: Monotributista, Monotributista(带或不带逗号)

没有配置参数的tesseract,换句话说,就是5页文字 Nfonotributista

因此,我尝试使用用户单词,也许它可以使用以下代码纠正该问题:

load_system_dawg F 
load_freq_dawg F
user_words_suffix user-words

没有错误,但是结果相同,我找不到太多文档来了解背后发生的事情,是否使用配置?是否尝试对字典使用OCRed单词? 我的代码有什么问题吗?

感谢您的帮助 谢谢!

编辑:添加了一些字符,但识别不佳: 第一个检测到LIL或LII Detects LIL or LII

第二次检测到LI Detects LI

0 个答案:

没有答案