Tesseract歧义文件在编辑时的工作方式不同

时间:2016-04-27 08:49:54

标签: tesseract ambiguity training-data unichar

我想编辑一些文字,如女性和男性,因为当我测试它们时,我发现它们是FemaIe和MaIe(我的意思是资本我不小L(l))。我想用像amb;

这样的ambfile来解决这个问题

V1

6_tab_F_e_m_a_I_e_tab_6_tab_F_e_m_a_l_e_tab_1

4_tab_M_a_I_e_tab_4_tab_M_a_l_e_tab_1

但是当我重新测试我的结果时,他们的情况更糟。我发现女性为F,男性为M. 我做错了什么?像这样使用amb文件是个错误的想法?

1 个答案:

答案 0 :(得分:0)

根据Tesseract Training Wiki,字段应按制表符分隔。