我正在与PIL,OpenCV和OCR阅读器一起阅读图像中的文本。我遇到的最大问题是图像处理使文本足够清晰,以便OCR阅读器更容易/准确地提取。
为此,我想到了增加对比度/亮度并使用PIL进行直方图均衡,但这也无济于事。
那么,你有什么建议让文本看起来更清晰,以便更好地提取文本?
答案 0 :(得分:2)
PIL有sharpen and edge enhancing filters。这是你想要的吗?显示您正在处理的内容的示例图像将会有所帮助。
您的图像背景颜色不均匀,可能会导致问题。尝试查看this solution以创建一个漂亮的水平b& w图像。
但黑领也会引起问题,你应该看看如何裁剪它。
也就是说,我通过一个简单的PIL SHARPEN过滤器得到了合理的改进:
在SHARPEN过滤器后的tesseract结果:
从我在内心深处学到的东西,^我已经决定了人类 有些人在飓风和冰块之间的某个地方 尊重,永久神秘,但在其他方面 - 有足够的科学 并且小心谨慎地scrutabler这将是愚蠢的 我们认为我们已经达到了人类知识的极限 我想我们可以知道一切。还有足够的空间 变得更好,向我提问即使是死者,也要学习 知道我们的确定时间是错误的。
没有过滤器的结果:
从我学到的知识lnnkmg wade maple} Fve deculed lunnuan wlng;。 EL&#39 ;. .y.w.r-A'为
between a luurrlctuvr null llva la
全部&#39。一个。I ll respects, permanently unyst:-rwnt
毫升。有足够的scaena) 和turutul pmlulng l~m。他会像loallsla一样 谢谢我们已经达到了想要的人类知识 我们可以知道一切。还有足够的空间可以得到 更好的是,询问“甚至死者”的问题,从知道什么时候学习 我们简单的证明是错误的。