标签: tesseract ambiguity training-data unichar
我想编辑一些文字,如女性和男性,因为当我测试它们时,我发现它们是FemaIe和MaIe(我的意思是资本我不小L(l))。我想用像amb;
V1
6_tab_F_e_m_a_I_e_tab_6_tab_F_e_m_a_l_e_tab_1
4_tab_M_a_I_e_tab_4_tab_M_a_l_e_tab_1
但是当我重新测试我的结果时,他们的情况更糟。我发现女性为F,男性为M. 我做错了什么?像这样使用amb文件是个错误的想法?
答案 0 :(得分:0)
根据Tesseract Training Wiki,字段应按制表符分隔。