我开发了一个只识别数字的OCR项目,所以我有这个:
tessAPI.init(path, "eng");
tessApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
tessApi.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "0123456789");
tessApi.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST,"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmopqrstuvwxyz");
EDITED: 除了上面的代码片段, 我以这种方式检索输出---
this.text = tessApi.getUTF8Text();
在logcat视图中我有这个--- 修改的扫描结果是>>>>>>>
/,l<‘|’ll Assovm'l‘rss
Rd. N.» 3669—87025
\‘cr1;1|N0.1 5559733‘698236653 V
I’m' 0008-0443—2248-0099
Dun-"l imc: 05/01/2015 10:41 AM
要对位图进行二值化,我有这个:
Pix pixValue = Binarize.otsuAdaptiveThreshold(handle);
//上述
的转换速度有点慢In my assets folder, I have eng.traineddata
但问题在于,它不是将字母表跳过/黑名单,而是用数字替换它们。哪里错了。