标签: python opencv ocr tesseract
我正在尝试预处理示例图片:
在将其传递给OCR引擎之前。
它充满了噪音,我对琴弦感兴趣(ARS,0-1,TOT,04:02)
我正在尝试一些方法: 首先我将图像缩放了300%,这样会更容易,接下来我应用灰度来尽可能地清除噪点。
一个。自适应阈值
湾笔画宽度变换
℃。精明的边缘
在某些情况下,我能够读取字符串ARS(使用阈值127)和一些字符串04:02(SWT帮助了它)
我是计算机视觉的新手,并尽可能多地学习清除噪音的技巧,让OCR引擎(tesseract)更容易获得读取字符串