将tesseract字符限制为a-z并仅在我的iOS应用中编号

时间:2013-03-22 11:13:55

标签: ios ocr tesseract

我正在使用tesseract来识别我的iOS项目中的角色。它现在正在读取所有字符,包括字母数字字符。但我想只读字符a-z和数字0-9。我跟着Limit characters tesseract is looking for,但无法弄清楚如何在我的iOS应用中实现这一点。

有人可以建议我如何在我的iOS项目中实现这一点。

2 个答案:

答案 0 :(得分:7)

您可以在提取前使用TessBaseAPI.SetVariable指定白名单(允许的字符)

 tesseract->SetVariable("tessedit_char_whitelist", "abcdefghijklmnopqrstuvwxyz012345789");

答案 1 :(得分:1)

试试这个:

[tesseract setVariableValue:@"abcdefghijklmnopqrstuvwxyz012345789" forKey:@"tessedit_char_whitelist"];

你也可以尝试变量" tessedit_char_blacklist"