我真的需要你的帮助,我很绝望。
我正在尝试构建一个OCR应用程序,但我遇到了一些我无法单独解决的问题。 现在我正在从图像切割板并进行一些过滤以减少噪音。 例如,这是从图像中切割后和过滤后的印版:
现在因为盘子处于角度并且因为仍然存在噪音(如数字9和3之上),识别过程(使用corr2)给我错误的数字。
例如:
如你所见,唯一的问题是数字9和3(在左侧)噪音令人不安。
我想拉伸图像,以便每个数字都适合所有方块(顶部没有黑线),但我找不到任何方法来做到这一点,它将适用于每个图像。
编辑:这是corr2函数的结果,我用红色标记了数字9和3的结果。
请给我一个想法或工作解决方案......
任何帮助将不胜感激。
答案 0 :(得分:1)
您可以预先处理您在上一个问题中发布的图片:
类似于:( Mathematica中的代码)
Dilation[
DeleteSmallComponents[
Pruning[
Thinning@
Binarize[
ColorSeparate[
ColorNegate@yourColorImage, "HSB"][[3]],
.92],
10],
30],
3]
结果:
现在你的OCR应该没有太多麻烦,就像这个:
修改强>
的分步流程