使用tesseract优化图像以进行文本识别

时间:2013-04-05 07:58:01

标签: android opencv tesseract

我有用户tesseract ocr我的android项目识别从相机拍摄的图像中的文本。但结果并不准确。我想使用opencv优化图像。我想为捕获的图像实现以下功能,该图像以 Bitmap.Config.ARGB_8888 格式解码:

  1. 检测已调整大小的图像中的对象。
  2. 识别完对象后,计算其原始图像的边界。 (这是为了消除相机角度效果)
  3. 通过应用透视变换从原始图像中提取对象。
  4. 应用白平衡以消除闪电效果。
  5. 在tess_two api提供的示例中,他们使用 Leptonica 进行图像处理,比如绘制单词周围的边框。但在我的情况下,我想使用 OpenCV ...您的指导将受到高度赞赏......

1 个答案:

答案 0 :(得分:0)

这是你要求的很多,取决于对象可能是不可能的。您应该查看有关2D特征检测和对象检测(http://docs.opencv.org/doc/tutorials/features2d/table_of_content_features2d/table_of_content_features2d.htmlhttp://docs.opencv.org/doc/tutorials/objdetect/table_of_content_objdetect/table_of_content_objdetect.html)的教程,看看是否有可以使用的东西。

白平衡对光照没有任何作用,你应该进行自适应阈值处理或某种高通滤波。