文档OCR /可读性的图像处理/增强算法?

时间:2009-04-03 19:06:00

标签: ocr

我正在寻找算法,论文或软件来增强传真,手机摄像头的图像以及其他类似的可读性和OCR来源。

我主要对简单的增强感兴趣(例如你可以用ImageMagick做的事情),但我也对更复杂的技术感兴趣。我已经和供应商谈过了,所以对于这个问题,我主要是寻找算法或开源软件。

进一步澄清:我不是在寻找OCR软件或算法;我正在寻找算法来清理图像,使其看起来对人眼更具可读性,并且可以用于OCR。

3 个答案:

答案 0 :(得分:5)

当我写一些软件进行书籍扫描时,我遇到了类似的问题;漂浮在互联网上的是一个名为pagetools的程序,它使用一种称为Radon变换的相当聪明的数学技巧来拉直扫描页面。

我还写了一个小例程,它会使页面上的空白变白;当OCR算法不必与背景噪声竞争时,它们往往会做得更好。我所做的是寻找距离深色的像素不到一个小半径的浅色像素,然后将它们提升为纯白色。

但是,已经有几年了,所以我没有准确的实施细节。

答案 1 :(得分:4)

要查看的一个简单的图像过滤器是“中位数过滤器”,它非常简单,易于实现,过滤器有助于清理扫描/拍摄的文本。 http://en.wikipedia.org/wiki/Median_filter

答案 2 :(得分:2)

根据要求,链接到维基百科:Optical character recognition

Microsoft Research:Optical character recognition papers

CiteSeerX:Papers on optical character recognition