为什么Tesseract OCR引擎使用诸如Otsu二值化之类的全局阈值技术?局部阈值处理技术(例如Sauvola,Niblack等)在删除图像中的文本时是否更有效?
答案 0 :(得分:1)
基本上,根据输入图像,我们需要选择要使用的阈值算法。 Tesseract使用Otsu方法进行阈值处理,因为通常Tesseract用于提取文本的输入具有图像均匀性。 Otsu方法对于此类图像既有效又足够好。
当背景相对于前景(目标)强度没有局部变化时,全局阈值方法非常有用且足够好。当背景和目标的强度差异之间发生局部变化时,需要进行局部阈值处理。
因此,尽管Tesseract确实使用Otsu方法(全局阈值)进行二值化,但是您可以使用局部阈值方法对图像进行预处理,以从Tesseract获得更好的输出。
答案 1 :(得分:0)
Tesseract用于Google图书项目和AFAIK中,它们运行测试以实现最佳二值化,而Otsu最通用。如果Otsu并非最适合您的情况,则可以在将图像发送到tesseract之前使用其他二值化算法。