我正在尝试回忆一些关于字母的信息,以便用神经网络开始某种OCR。我还没有把所有的东西加在一起,但是,我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西 (没什么特别的,只是普通的字体)
我认为更好的方法是制作大量的for循环以获得顶部,最低的x和y,考虑到每个角色和数字都有相互连接的黑色像素(尽管我是个例外)。
是否有任何类型的库或算法可以帮助我解决这个问题?我正在使用Cimg进行图像处理。
真的难吗?