Tesseract训练角色大小和频率

时间:2016-06-26 09:10:09

标签: tesseract

Tesseract的文档说:

  

确保每个角色的样本数量最少。 10   很好,但5对于稀有人物来说是可以的。

     

应该有更多频繁字符的样本 - 在   至少20。

  1. 我假设最后一句意思是:至少20个更频繁字符的样本就可以了。但是什么是一个好的频率?
  2. 此外:

      

    Tesseract最适用于DPI至少为300 dpi的图像,   所以调整图像大小可能是有益的。有关更多信息,请参阅   常见问题。

    1. 为什么Tesseract在300 DPI上效果最好? DPI不仅仅是一个设置,告诉您图像的打印尺寸是多少?为什么选择DPI而不仅仅是像素的最小高度?
    2. 另外,角色的高度是多少?

0 个答案:

没有答案