我的图像给我不一致的结果。我的思考过程是:我的文本始终为白色字体;如果我可以将文本的像素切换为黑色,并将其他所有像素都切换为白色或透明,那么我将获得更好的成功。
我的问题是,哪种图书馆或语言最适合?我是否必须将我的白色像素变成一些独特的RGB,将其他所有颜色都变成白色或透明,然后找到独特的RGB并将其变成黑色?任何帮助表示赞赏。
答案 0 :(得分:1)
是的,如果您可以将文本像素设置为黑色,而将所有其他文档设置为白色,则可能会取得更好的成功,尽管并非总是可能的,但有些过程可以提供帮助。
中值滤波器(和其他低通滤波器)可用于去除图像中出现的噪声。
侵蚀还可以帮助去除字符以外的东西,例如细线和杂音。
对齐文本也是一个好主意,如果文本未对齐,OCR准确性可能会大大下降。为此,您可以尝试Hough变换,然后进行旋转。使用Hough变换在文本中找到一条线,然后以与该线相同的角度旋转图像。
提到的所有处理步骤都可以使用opencv或scikit-image完成。
还要指出,还有许多其他处理文本的方法,很多都不能提及。