Java Android:Tesseract不会将字母表列入黑名单

时间:2015-08-17 07:09:27

标签: java android eclipse

我开发了一个只识别数字的OCR项目,所以我有这个:

tessAPI.init(path, "eng");
tessApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
      tessApi.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "0123456789");
      tessApi.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST,"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmopqrstuvwxyz");

EDITED: 除了上面的代码片段, 我以这种方式检索输出---

this.text = tessApi.getUTF8Text();

在logcat视图中我有这个--- 修改的扫描结果是>>>>>>>

/,l<‘|’ll Assovm'l‘rss
Rd. N.» 3669—87025
\‘cr1;1|N0.1 5559733‘698236653 V
I’m' 0008-0443—2248-0099
Dun-"l imc: 05/01/2015 10:41 AM

要对位图进行二值化,我有这个:

Pix pixValue = Binarize.otsuAdaptiveThreshold(handle); 

//上述

的转换速度有点慢
In my assets folder, I have eng.traineddata

但问题在于,它不是将字母表跳过/黑名单,而是用数字替换它们。哪里错了。

0 个答案:

没有答案