Question

我不熟悉Tesseract，这是我第一次尝试OCR。

我正在尝试检测下图中的所有字符行，每行是一个单词：

我正在运行以下代码来尝试获取文本：

 baseAPI.setImage(bitmap);
 String charsFromImage = baseAPI.getUTF8Text();

但是，我得到的输出是：

LGQTKCELASELOHW

ZVCGCNUYRNNL

H

LKBK

OVPSMIMEETNGL

J

W

A

C

VNTZRRTMKEBR

LGRTTL

E Y

RSTSWOOL

CRRSRDMRRRRD

HMQOQUENKAGPPQDE

LDPD

TCQLDCRRMZAE

FNECTMFKCLMRRRL

N

TORRO

LPAHNQMHS

ENAUCOMPET

FYCMH

EQCF

L

M

LMTRVI E

L

L

BNPNRRTCPL

L J

E

ATERZADWZAZA

GTURNOVERNCKMDSH

TXMKS

ATNEMTSEVN

即使这是清晰的图像，也无法正确返回。

任何帮助将不胜感激！

Answer 1

嗯，请尝试使用“稀疏文本”页面细分模式：baseAPI.setPageSegMode(PSM_SPARSE_TEXT);。

Tess-两个TessBaseAPI未检测到图像中的所有字符

1 个答案: