我正在尝试获取OCR可读的黑板图像。当然,大多数OCR软件都不喜欢脏图像。我应该尝试将图像放到哪个图像处理来清理图像?
答案 0 :(得分:4)
您是否尝试过OCR软件? OCR软件很可能非常适合阅读基本上已经是黑白图像的内容。
但是,如果您被要求这样做,您可以尝试:
这个想法是通过扩张然后侵蚀你将删除任何粗糙/嘈杂的边缘然后你可以将镂空图像传递给OCR。
可能有很多方法可以达到类似的效果。鉴于有完整的专用于计算机视觉的书籍,这个答案几乎不会公正。
我所拥有的唯一文本是从1997年开始的,但自那时以来,关于这个主题的文章肯定还有更多。
答案 1 :(得分:1)
另一方面,我会说反转图像(反转颜色,使白色写入为黑色)并略微增加对比度。您可以尝试修改亮度以使擦除的粉笔模糊消失在背景中。
答案 2 :(得分:1)
在Photoshop中,色阶对话框可能是您最有用的图像调整。在代码中模仿这是完全另一个主题。
级别的基础是您调整亮度级别的最大值,最小值和中点。通常在直方图上显示,您可以调整点以获得所需的对比度,但也可以移动中点,使图像中的文本定义最明确;对OCR应用至关重要。通过移动中点,您可以“消除”通常围绕手写的灰度模糊,使其消失在图像的光(或暗)区域。
此外,您可以尝试在调整后将图像转换为1位,将所有内容强制为黑色或白色。有时这会加速OCR过程。但要小心,它也会丢弃细节。
答案 3 :(得分:1)
您是否尝试过Roberts Cross和Sobel算子等边缘检测技术来滤除图像中的噪点?如果没有看到图像的质量,就不能说它有多么有效。
答案 4 :(得分:1)
不确定您在选择OCR解决方案方面受到的限制,但ABBYY OCR引擎(以及基于它的Web API,http://www.wisetrend.com/wisetrend_ocr_cloud.shtml)包括自动图像清理/纹理删除选项。
答案 5 :(得分:0)
有商业解决方案,但清理电路板图像似乎是open problem。将OCR添加到未解决的问题中,您会得到一个未解决的问题。