是否可以将tesseract的识别限制为仅限于“abcdABCD”的四个字符?我已经尝试了这个link并在我的文件夹 TESSDATA 中创建了一个“.cfg”文件,该文件位于我的项目文件夹中。
C:\ Users \ Julian Concepcion \ Desktop \ MyProject \ MyProject \ tessdata
它被命名为 config.cfg ,在config.cfg中是“tessedit_char_whitelist abcdABCD”,但我不知道如何在c#中使用它。这就是我称之为tesseract的方式
tess = new Tesseract("C:\\Users\\Julian Concepcion\\Desktop\\MyProject\\MyProject\\tessdata", "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_CUBE_COMBINED);
答案 0 :(得分:0)
就像建议的链接一样:
tesseract->SetVariable("tessedit_char_whitelist", "abcdABCD");
无需创建任何配置文件。