Question

尝试在上面有瓷砖的Scrabble板上进行OCR： Base image

我将图像分为15行和15列，从而为每个板点提供225张单独的图像。我使用PageSegMode 10对每个图像进行OCR，并获得以下输出，并将其格式化为板状2D数组：

[y, b, i, R, o, ;, i, ., .|, ). ., ., “, =, E, ﬂ]
[i, w, M, f, ;, , “, ﬁ, O, , ., “, =, i, T]
[., i, U, i, ﬁ, i, B, B, E, m, ., “, ., ., .]
[], ﬁ, i, ., H, ?, ﬁ, 3, , B, ., L, -, -, -]
[f, :, -, }, ., i, i, o, , B, woro, P, H, am, H]
[?, , :, o, , _, b, B, , i, e, ], ], , ]]
[:, ﬁ, B, B, , o, ], q, , o, ], ], ], ], N]
[@, :, -, , ﬂ, , , , , , , R, o, ], N]
[, ;, B, g, , N, j, ?, ,, Q, |, o, ], ], ]]
[3, ., b, , E, 1, , 1, n, m, e ], ], ], , |]
[?, , o, d, ?, ﬁ, , E, o, T, ., %, ], ], l]
[], -, R, , P, 4, , ”, l, |, 3, , %, R, q]
[], -, , c, ), 4, , W, 1, J, ], |, ., -, O]
[R, -, c ], ], -, , , R, T, ., - |, -, ], , J]
[TRIPLE, t |, 7, 1, !, ], -, , : |, ], -, @, j, ], ]

如何从中获得所需的输出：

[, , , , , , , , , , , , , , ,]
[, , , , , , , , , , , , , , ,]
[, , , , , , , , D, , , , , , ,]
[, , , , , , , , E, , , , , , ,]
[, , , , , , , , L, , , , , , ,]
[, , , , W, , , , U, , , , , , ,]
[, , , , O, , , , X, , , , , , ,]
[, , , G, R, E, A, T, E, S, T, , , , ,]
[, , , , L, , , , , , , , , , ,]
[, , , E, D, I, T, I, O, N, , , , , ,]
[, , , , , , E, , , , , , , , ,]
[, , , , , , A, , , , , , , , ,]
[, , , , , , C, , , , , , , , ,]
[, , , , , , H, , , , , , , , ,]
[, , , , , , , , , , , , , , ,]

现在，我将基本图像二进制化，然后将其拆分为每个图块，如附件文件所示。我假设我缺少某种关键的预处理步骤，或者设置错误或其他原因。我可以使用OpenCV提供帮助吗？我一直在寻找年龄，所以我将不胜感激！

编辑：该过程也应适用于不同的木板图像。

Java-Tesseract无法识别单个字符图像的原因可能是什么？

0 个答案: