应用错误收集

我正在尝试从文本行图像中提取字符'图像，以便我可以将这些图像提供给我的K-Nearest Neighbor分类（我正在构建自己的OCR系统）。

我已检索文本行图像，并想知道如何继续提取字符。

我的第一次尝试是使用水平投影来剪切图像（来自二进制图像）：

我的第二次尝试是检索已连接组件的轮廓，并将它们作为单独的字符进行处理。这种尝试获得了良好的结果，但是例如由于两个断开的轮廓而无法检索字母“i”。

当两个角色彼此太近（或折叠）时，这两个尝试都失败了。

你有什么建议吗？我正在尝试将两种方法结合起来，但仍然不成功。

注意：这是出于学习目的。这就是为什么我不想使用现有的解决方案，除了使用OpenCV进行正常的图像处理。 K-Nearest Neighbor是强制性的，因为它是OCR系统的主要部分。