识别图像上字符的开始和结束XY向量

时间:2011-09-25 21:52:57

标签: c++ cimg

我正在尝试回忆一些关于字母的信息,以便用神经网络开始某种OCR。我还没有把所有的东西加在一起,但是,我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西 (没什么特别的,只是普通的字体)

我认为更好的方法是制作大量的for循环以获得顶部,最低的x和y,考虑到每个角色和数字都有相互连接的黑色像素(尽管我是个例外)。

是否有任何类型的库或算法可以帮助我解决这个问题?我正在使用Cimg进行图像处理。

真的难吗?

2 个答案:

答案 0 :(得分:1)

听起来您正在寻找连接组件贴标机。我们的想法是扫描图像中相互连接的像素组,并返回一组对象(通常称为“blob”),其中每个对象都包含该blob中像素的列表。

我不建议你自己写。 OpenCV有一个内置的,运行良好,基于

F.Chang,C.-J.Chen,and.C.-J.Lu,“使用轮廓追踪技术的线性时间分量标记算法”,计算机视觉和图像理解,第一卷。 93,不。 2,pp.206-220,2004。

很有可能是一个更好的解决方案,专门用于寻找信件。

答案 1 :(得分:0)

你检查过OpenCV项目了吗? Here是一个使用它进行数字OCR的教程。