Java-Tesseract无法识别单个字符图像的原因可能是什么?

时间:2019-12-30 19:13:37

标签: java ocr tesseract tess4j

尝试在上面有瓷砖的Scrabble板上进行OCR: Base image

我将图像分为15行和15列,从而为每个板点提供225张单独的图像。我使用PageSegMode 10对每个图像进行OCR,并获得以下输出,并将其格式化为板状2D数组:

[y, b, i, R, o, ;, i, ., .|, ). ., ., “, =, E, fl]
[i, w, M, f, ;, , “, fi, O, , ., “, =, i, T]
[., i, U, i, fi, i, B, B, E, m, ., “, ., ., .]
[], fi, i, ., H, ?, fi, 3, , B, ., L, -, -, -]
[f, :, -, }, ., i, i, o, , B, woro, P, H, am, H]
[?, , :, o, , _, b, B, , i, e, ], ], , ]]
[:, fi, B, B, , o, ], q, , o, ], ], ], ], N]
[@, :, -, , fl, , , , , , , R, o, ], N]
[, ;, B, g, , N, j, ?, ,, Q, |, o, ], ], ]]
[3, ., b, , E, 1, , 1, n, m, e ], ], ], , |]
[?, , o, d, ?, fi, , E, o, T, ., %, ], ], l]
[], -, R, , P, 4, , ”, l, |, 3, , %, R, q]
[], -, , c, ), 4, , W, 1, J, ], |, ., -, O]
[R, -, c ], ], -, , , R, T, ., - |, -, ], , J]
[TRIPLE, t |, 7, 1, !, ], -, , : |, ], -, @, j, ], ]

如何从中获得所需的输出:

[, , , , , , , , , , , , , , ,]
[, , , , , , , , , , , , , , ,]
[, , , , , , , , D, , , , , , ,]
[, , , , , , , , E, , , , , , ,]
[, , , , , , , , L, , , , , , ,]
[, , , , W, , , , U, , , , , , ,]
[, , , , O, , , , X, , , , , , ,]
[, , , G, R, E, A, T, E, S, T, , , , ,]
[, , , , L, , , , , , , , , , ,]
[, , , E, D, I, T, I, O, N, , , , , ,]
[, , , , , , E, , , , , , , , ,]
[, , , , , , A, , , , , , , , ,]
[, , , , , , C, , , , , , , , ,]
[, , , , , , H, , , , , , , , ,]
[, , , , , , , , , , , , , , ,]

现在,我将基本图像二进制化,然后将其拆分为每个图块,如附件文件所示。 我假设我缺少某种关键的预处理步骤,或者设置错误或其他原因。我可以使用OpenCV提供帮助吗?我一直在寻找年龄,所以我将不胜感激!

编辑:该过程也应适用于不同的木板图像。

0 个答案:

没有答案