我希望在某种复杂的图像中提高文本识别的准确性。
我目前正在使用以下示例代码:
https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/textdetection.cpp
我尝试检测此图片中的文字:
https://i.ytimg.com/vi/WFobUoRn6Ek/maxresdefault.jpg
(注意:这是我试图处理的类似镜头)
结果:
还有很多问题,但对我来说最大的问题是小写字母很容易被遗漏或被错误识别。
e.g.) 'i' became l
e.g.) 'in' became 'm'
e.g.) 'l' can be gone...
我认为问题与erFilter产生的图像有关。 如图所示,此时已经省略了一些小部件。
如果有一个避免这种小部件遗漏的好方法,请告诉我。
可能是对图像进行某种预处理?
注意: 我已经检查了以下帖子,但我的目标镜头类似于“失败”的例子。案件在他的论文中。