为什么Tesseract OCR使用Otsu二值化?

时间:2019-06-24 06:08:29

标签: ocr tesseract image-thresholding

为什么Tesseract OCR引擎使用诸如Otsu二值化之类的全局阈值技术?局部阈值处理技术(例如Sauvola,Niblack等)在删除图像中的文本时是否更有效?

2 个答案:

答案 0 :(得分:1)

基本上,根据输入图像,我们需要选择要使用的阈值算法。 Tesseract使用Otsu方法进行阈值处理,因为通常Tesseract用于提取文本的输入具有图像均匀性。 Otsu方法对于此类图像既有效又足够好。

当背景相对于前景(目标)强度没有局部变化时,全局阈值方法非常有用且足够好。当背景和目标的强度差异之间发生局部变化时,需要进行局部阈值处理。

因此,尽管Tesseract确实使用Otsu方法(全局阈值)进行二值化,但是您可以使用局部阈值方法对图像进行预处理,以从Tesseract获得更好的输出。

答案 1 :(得分:0)

Tesseract用于Google图书项目和AFAIK中,它们运行测试以实现最佳二值化,而Otsu最通用。如果Otsu并非最适合您的情况,则可以在将图像发送到tesseract之前使用其他二值化算法。