应用错误收集

时间：2011-09-25 21:52:57

标签： c++ cimg

我正在尝试回忆一些关于字母的信息，以便用神经网络开始某种OCR。我还没有把所有的东西加在一起，但是，我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西（没什么特别的，只是普通的字体）

我认为更好的方法是制作大量的for循环以获得顶部，最低的x和y，考虑到每个角色和数字都有相互连接的黑色像素（尽管我是个例外）。

是否有任何类型的库或算法可以帮助我解决这个问题？我正在使用Cimg进行图像处理。

真的难吗？

答案 0 :(得分：1)

听起来您正在寻找连接组件贴标机。我们的想法是扫描图像中相互连接的像素组，并返回一组对象（通常称为“blob”），其中每个对象都包含该blob中像素的列表。

我不建议你自己写。 OpenCV有一个内置的，运行良好，基于

F.Chang，C.-J.Chen，and.C.-J.Lu，“使用轮廓追踪技术的线性时间分量标记算法”，计算机视觉和图像理解，第一卷。 93，不。 2，pp.206-220,2004。

很有可能是一个更好的解决方案，专门用于寻找信件。

答案 1 :(得分：0)

你检查过OpenCV项目了吗？ Here是一个使用它进行数字OCR的教程。