在OCR(光学字符识别)之前,您会建议使用哪种软件进行图像增强?

时间:2008-09-27 01:56:08

标签: java .net image-processing ocr image-enhancement

我们目前正在研究在提交给OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance的Scansoft API(v15)。我们正在研究Lead Tools,但后来决定去其他地方寻找。与Lead Tools相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜,去除斑点,去除线,去除打孔,锐化等。我们正在运行.NET和Java软件,但首选java解决方案。

7 个答案:

答案 0 :(得分:4)

Kofax有利于预处理,但对于你所谈论的清理类型可能有点过分,除非图像非常糟糕。除非您的专业是图像处理,否则我建议您与提供图像处理和OCR的提供商合作,以便您可以专注于实际添加的值。

我们从ABBYY(ABBY SDK)获得OCR开发套件的许可,并且发现它对于图像处理和OCR都非常出色。 API非常广泛,示例应用程序,帮助和支持令人印象深刻。我绝对建议你去看看。

答案 1 :(得分:1)

免责声明:我在Atalasoft工作

我们拥有.NET的这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有OCR组件,包括用于Abbyy,Tesseract等的.NET包装器和可搜索的PDF生成(图像在PDF文本的顶部)

答案 2 :(得分:0)

不确定这是否符合您们需要的标准,但也许您应该查看一些Paint.Net API。我不知道提取他们的图像处理算法以便在您的项目中使用是多么容易,但我相信他们会做一些您正在寻找的事情。此外,它是一个带有MIT许可证的开源项目,因此对于商业用途应该非常友好。

答案 3 :(得分:0)

在KOFAX.com上研究KOFAX VRS

答案 4 :(得分:0)

也许JMagick,它是ImageMagick的开源Java界面。它以瘦Java本机接口(JNI)层的形式实现到ImageMagick API中。它是根据LGPL许可的,所以它不应该是许可证的问题。

http://sourceforge.net/projects/jmagick/

答案 5 :(得分:0)

我建议Intel获得零成本运行时许可。

答案 6 :(得分:0)

取决于原始图像的数量和质量。托管代码和映像工具包可以使用,但如果您需要处理数百万个图像,它并不总是最佳解决方案。对于小批量和预算紧张,我同意以前的海报,像 Aforge,Paint.NET 和其他开源计算机视觉库这样的项目可以解决这个问题。当然,如果结果没有改善,那么你就是独立的......至少你可以在一个应用程序中以低成本放置所需的一切。

如果您每月处理数十万张图片,那么我建议您将流程分成较小的工作流程步骤并调整每个图像,直到每张图片的成本尽可能接近零。您会发现OCR结果首先快速上升,然后比您预期的更快地平稳。 (我不是OCR的忠实粉丝,但它有它的位置)

我使用来自 Recogniform 的商业Windows产品,在批处理模式下使用针对各种图像调整的脚本在OCR之前处理和清理图像。如果图像因QC失败或被OCR引擎拒绝,则使用使用 Atalasoft 工具包构建的自定义.NET应用程序手动“修复”。批处理所有内容,只触摸失败的内容。