我正在寻找算法,论文或软件来增强传真,手机摄像头的图像以及其他类似的可读性和OCR来源。
我主要对简单的增强感兴趣(例如你可以用ImageMagick做的事情),但我也对更复杂的技术感兴趣。我已经和供应商谈过了,所以对于这个问题,我主要是寻找算法或开源软件。
进一步澄清:我不是在寻找OCR软件或算法;我正在寻找算法来清理图像,使其看起来对人眼更具可读性,并且可以用于OCR。
答案 0 :(得分:5)
当我写一些软件进行书籍扫描时,我遇到了类似的问题;漂浮在互联网上的是一个名为pagetools的程序,它使用一种称为Radon变换的相当聪明的数学技巧来拉直扫描页面。
我还写了一个小例程,它会使页面上的空白变白;当OCR算法不必与背景噪声竞争时,它们往往会做得更好。我所做的是寻找距离深色的像素不到一个小半径的浅色像素,然后将它们提升为纯白色。
但是,已经有几年了,所以我没有准确的实施细节。
答案 1 :(得分:4)
要查看的一个简单的图像过滤器是“中位数过滤器”,它非常简单,易于实现,过滤器有助于清理扫描/拍摄的文本。 http://en.wikipedia.org/wiki/Median_filter
答案 2 :(得分:2)
根据要求,链接到维基百科:Optical character recognition
Microsoft Research:Optical character recognition papers
CiteSeerX:Papers on optical character recognition