关于在黑板的图像上使用OCR的建议

时间:2010-05-17 20:37:16

标签: image image-processing ocr computer-vision image-recognition

我正在尝试获取OCR可读的黑板图像。当然,大多数OCR软件都不喜欢脏图像。我应该尝试将图像放到哪个图像处理来清理图像?

6 个答案:

答案 0 :(得分:4)

您是否尝试过OCR软件? OCR软件很可能非常适合阅读基本上已经是黑白图像的内容。

但是,如果您被要求这样做,您可以尝试:

  1. 阈值图像。
    • 基本上采用图像的灰度版本并将其转换为黑/白像素
  2. 执行二进制扩张以增长剩余对象
  3. 进行二元侵蚀
  4. 这个想法是通过扩张然后侵蚀你将删除任何粗糙/嘈杂的边缘然后你可以将镂空图像传递给OCR。

    可能有很多方法可以达到类似的效果。鉴于有完整的专用于计算机视觉的书籍,这个答案几乎不会公正。

    我所拥有的唯一文本是从1997年开始的,但自那时以来,关于这个主题的文章肯定还有更多。

    • 图像处理和计算机视觉的算法 - J.R。帕克
    • 数字图像处理 - Gonzalez / Woods

答案 1 :(得分:1)

另一方面,我会说反转图像(反转颜色,使白色写入为黑色)并略微增加对比度。您可以尝试修改亮度以使擦除的粉笔模糊消失在背景中。

答案 2 :(得分:1)

在Photoshop中,色阶对话框可能是您最有用的图像调整。在代码中模仿这是完全另一个主题。

级别的基础是您调整亮度级别的最大值,最小值和中点。通常在直方图上显示,您可以调整点以获得所需的对比度,但也可以移动中点,使图像中的文本定义最明确;对OCR应用至关重要。通过移动中点,您可以“消除”通常围绕手写的灰度模糊,使其消失在图像的光(或暗)区域。

此外,您可以尝试在调整后将图像转换为1位,将所有内容强制为黑色或白色。有时这会加速OCR过程。但要小心,它也会丢弃细节。

答案 3 :(得分:1)

您是否尝试过Roberts Cross和Sobel算子等边缘检测技术来滤除图像中的噪点?如果没有看到图像的质量,就不能说它有多么有效。

答案 4 :(得分:1)

不确定您在选择OCR解决方案方面受到的限制,但ABBYY OCR引擎(以及基于它的Web API,http://www.wisetrend.com/wisetrend_ocr_cloud.shtml)包括自动图像清理/纹理删除选项。

答案 5 :(得分:0)

有商业解决方案,但清理电路板图像似乎是open problem。将OCR添加到未解决的问题中,您会得到一个未解决的问题。