opencv中的二值化和背景过滤

时间:2014-02-11 08:11:04

标签: opencv image-processing ocr tesseract

很快,我想在OCR之前制定预处理程序,建议来自ABBYY 's technology。文章分为两部分:

  • 后台过滤:从背景中分隔文字字符串。 enter image description here
  • 自适应二值化:可以正确检测线条和单词,并且可以达到更高的识别准确度。他们试图影响角色。 enter image description here enter image description here

我想知道有没有办法通过opencv来实现它们?任何建议或示例代码将不胜感激。

2 个答案:

答案 0 :(得分:3)

我建议您使用此代码:http://liris.cnrs.fr/christian.wolf/software/binarize/ 特别是狼的二值化,它在实践中非常有效,如果你想在opencv中使用它,它对c ++代码的需求变化很小。基本上你必须将指向图像数据的指针传递给这个函数。

答案 1 :(得分:2)

以下是几篇论文,希望它有用:

来自XEROX的论文:http://www.xrce.xerox.com/content/download/6708/51560/file/Binarising-camera-images-for-OCR.pdf

关于ocr的图像预处理的另一篇好文章:http://wbieniec.kis.p.lodz.pl/research/files/07_memstech_ocr.pdf