我一直想知道屏幕OCR和通常的扫描文本OCR之间的区别。我多年来一直在使用FineReader(并尝试过其他一些程序),我知道他们通常对扫描分辨率非常挑剔。在某种程度上,他们将无法识别从屏幕捕获的文本。对我来说,它看起来反直觉,因为屏幕上的文字通常几乎没有噪音,因为完美的单色背景。我看到Abbyy(FineReader制作人)现在提供ScreenshotReader。所以他们有一个单独的产品用于看似相同的任务,只是因为这个分辨率问题?我错过了重要的事吗? (除了赚更多钱的愿望:))
答案 0 :(得分:0)
是的,通过了解正确的解决方案,OCR质量会带来很多好处。
当你OCR图形文件时,它们通常包含具有分辨率的元数据,OCR程序可以使用它。元数据中的分辨率可能是错误的,然后盲目地使用它会使事情变得更糟。某些文件根本不包含分辨率数据。这就是为什么高端程序不仅仅依赖于元数据的原因 - 他们还试图通过查看可能使用相对大小和其他功能成为字符的对象来推断出正确的分辨率。
您所参考的屏幕截图阅读程序可以通过两个关键事项改善屏幕截图识别体验。首先,它知道确切的分辨率,并且可以利用它来改善OCR,并且它知道图像上没有噪声和没有失真,也没有其他类似的伪像,因此可以跳过一些预处理步骤,从而提高速度并增加OCR质量。其次,它提供了许多可用性改进 - 您不需要将屏幕截图保存到文件中,您可以轻松地在源程序窗口上设置识别区域,我想其他UI改进在一起只需使OCRing屏幕图像更容易,更快。