我不熟悉Tesseract,这是我第一次尝试OCR。
我正在尝试检测下图中的所有字符行,每行是一个单词:
我正在运行以下代码来尝试获取文本:
baseAPI.setImage(bitmap);
String charsFromImage = baseAPI.getUTF8Text();
但是,我得到的输出是:
LGQTKCELASELOHW
ZVCGCNUYRNNL
H
LKBK
OVPSMIMEETNGL
J
W
A
C
VNTZRRTMKEBR
LGRTTL
E Y
RSTSWOOL
CRRSRDMRRRRD
HMQOQUENKAGPPQDE
LDPD
TCQLDCRRMZAE
FNECTMFKCLMRRRL
N
TORRO
LPAHNQMHS
ENAUCOMPET
FYCMH
EQCF
L
M
LMTRVI E
L
L
BNPNRRTCPL
L J
E
ATERZADWZAZA
GTURNOVERNCKMDSH
TXMKS
ATNEMTSEVN
即使这是清晰的图像,也无法正确返回。
任何帮助将不胜感激!
答案 0 :(得分:0)
嗯,请尝试使用“稀疏文本”页面细分模式:baseAPI.setPageSegMode(PSM_SPARSE_TEXT);
。