Tess-两个TessBaseAPI未检测到图像中的所有字符

时间:2020-05-31 15:29:06

标签: java tesseract tess-two

我不熟悉Tesseract,这是我第一次尝试OCR。

我正在尝试检测下图中的所有字符行,每行是一个单词:

wordsearch

我正在运行以下代码来尝试获取文本:

 baseAPI.setImage(bitmap);
 String charsFromImage = baseAPI.getUTF8Text();

但是,我得到的输出是:

LGQTKCELASELOHW

ZVCGCNUYRNNL

H

LKBK

OVPSMIMEETNGL

J

W

A

C

VNTZRRTMKEBR

LGRTTL

E Y

RSTSWOOL

CRRSRDMRRRRD

HMQOQUENKAGPPQDE

LDPD

TCQLDCRRMZAE

FNECTMFKCLMRRRL

N

TORRO

LPAHNQMHS

ENAUCOMPET

FYCMH

EQCF

L

M

LMTRVI E

L

L

BNPNRRTCPL

L J

E

ATERZADWZAZA

GTURNOVERNCKMDSH

TXMKS

ATNEMTSEVN

即使这是清晰的图像,也无法正确返回。

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

嗯,请尝试使用“稀疏文本”页面细分模式:baseAPI.setPageSegMode(PSM_SPARSE_TEXT);