应用错误收集

我正在尝试构建一个CUSTOM语言，仅用于检测以下字符：

[＆＃39; A＆＃39;，＆＃39; B＆＃39;，＆＃39; C＆＃39;，＆＃39; D＆＃39;，＆＃39; E＆＃39;，＆＃39; F＆＃39;，＆＃39; G＆＃39;，＆＃39; H＆＃39;，＆＃39;我＆＃39;，＆＃39; J＆＃39;，＆＃39; K＆＃ 39;，＆＃39; L＆＃39;，＆＃39; M＆＃39;，＆＃39; N＆＃39;，＆＃39; O＆＃39;＆＃39; P＆＃39;，＆＃39; Q＆＃39;，＆＃39; R＆＃39;，＆＃39; S＆＃39;，＆＃39; T＆＃39;，＆＃39; U＆＃39;＆＃39; V＆＃39;，＆＃39; W＆＃39;，＆＃39; X＆＃39;，＆＃39; Y＆＃39;，＆＃39; Z＆＃39;，＆＃39; 0＆＃39;，＆＃39; 1＆＃39;，＆＃39; 2＆＃39;，＆＃39; 3＆＃39;，＆＃39; 4＆＃39;，＆＃39; 5＆＃39;，＆＃39; 6＆＃39;，＆＃39; 7＆＃39;，＆＃39; 8＆＃39;，＆＃39; 9＆＃39;，＆＃39;＆lt;＆＃39;，＆＃39;＆lt;＆lt;＆lt;＆＃39;，＆＃ 39 /＆＃39;]

我有近50张图片，我已经生成了盒子文件，纠正了错误。我的问题是针对上述自定义角色的训练tesseract是否需要使用由tesseract工具创建的图像，以便在创建cust.traindata时也用作输入

我已经制作了一个代码，从上面的数组中获取5个字符并使用tesseract工具构建图像，然后生成.box文件，该文件是正确的，并且不需要调整所有可能的配置但是因为tesseract as创建它需要给它来构建cust.traindata。

提前致谢。

培训Tesseract OCR以获得自定义语言所需的数据

1 个答案: