我在我的应用程序中使用了针对iOS的TesseractOCR,结果显示很多不可用的文本。
据我了解,识别是针对每个字符进行的,所以我很好奇是否可以说特定字符的置信度小于N时不返回任何内容...这样我就不会感到混乱这对我来说完全无法使用。
我尝试使用tesseract.charWhitelist
和tesseract.charBlacklist
来删除Tesseract难以识别的所有字符,而我不需要(因为我只对数字感兴趣) )。但是,所有字母字符都被数字代替而不是被忽略。
任何帮助都将受到高度赞赏。