Question

我开发了一个只识别数字的OCR项目，所以我有这个：

tessAPI.init(path, "eng");
tessApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
      tessApi.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "0123456789");
      tessApi.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST,"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmopqrstuvwxyz");

EDITED：除了上面的代码片段，我以这种方式检索输出---

this.text = tessApi.getUTF8Text();

在logcat视图中我有这个--- 修改的扫描结果是＆gt;＆gt;＆gt;＆gt;＆gt;＆gt;＆gt;

/,l<‘|’ll Assovm'l‘rss
Rd. N.» 3669—87025
\‘cr1;1|N0.1 5559733‘698236653 V
I’m' 0008-0443—2248-0099
Dun-"l imc: 05/01/2015 10:41 AM

要对位图进行二值化，我有这个：

Pix pixValue = Binarize.otsuAdaptiveThreshold(handle);

//上述

的转换速度有点慢

In my assets folder, I have eng.traineddata

但问题在于，它不是将字母表跳过/黑名单，而是用数字替换它们。哪里错了。

Java Android：Tesseract不会将字母表列入黑名单

0 个答案: