从文本行图像中检索字符'图像

时间:2016-11-08 13:17:26

标签: python opencv ocr

我正在尝试从文本行图像中提取字符'图像,以便我可以将这些图像提供给我的K-Nearest Neighbor分类(我正在构建自己的OCR系统)。

我已检索文本行图像,并想知道如何继续提取字符。

我的第一次尝试是使用水平投影来剪切图像(来自二进制图像): Horizontal Projection

我的第二次尝试是检索已连接组件的轮廓,并将它们作为单独的字符进行处理。这种尝试获得了良好的结果,但是例如由于两个断开的轮廓而无法检索字母“i”。

当两个角色彼此太近(或折叠)时,这两个尝试都失败了。

你有什么建议吗?我正在尝试将两种方法结合起来,但仍然不成功。

注意:这是出于学习目的。这就是为什么我不想使用现有的解决方案,除了使用OpenCV进行正常的图像处理。 K-Nearest Neighbor是强制性的,因为它是OCR系统的主要部分。

0 个答案:

没有答案