应用错误收集

OpenCV + Tesseract：改进从复杂图像（如scenary）中检测文本（信用）

时间：2016-10-11 01:29:19

标签： c++ opencv ocr tesseract

我希望在某种复杂的图像中提高文本识别的准确性。

我目前正在使用以下示例代码：

https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/textdetection.cpp

我尝试检测此图片中的文字：

https://i.ytimg.com/vi/WFobUoRn6Ek/maxresdefault.jpg

（注意：这是我试图处理的类似镜头）

结果：

还有很多问题，但对我来说最大的问题是小写字母很容易被遗漏或被错误识别。

e.g.) 'i' became l
e.g.) 'in' became 'm'
e.g.) 'l' can be gone...

我认为问题与erFilter产生的图像有关。如图所示，此时已经省略了一些小部件。

如果有一个避免这种小部件遗漏的好方法，请告诉我。可能是对图像进行某种预处理？

注意： 我已经检查了以下帖子，但我的目标镜头类似于“失败”的例子。案件在他的论文中。

Detect white characters on black background using Tesseract

0 个答案:

没有答案