标签: python image opencv numpy
我正在尝试从主要包含不同类型字体的句子的图片中提取单词的图像。例如,请考虑以下情况:
现在我想要提取克林顿,街等单词的单个图像,如下所示:
我尝试应用二进制扩张,但白色和黑色区域之间的距离几乎可以忽略不计。但是,当我第一次裁剪原始图像中的空白区域然后在具有较低F1值的裁剪图像上重新进行二进制扩张时,取得了一些成功。
从这张照片中分离单词图像的最佳和高精度方法应该是什么?
Ps:我正在关注此博客post,以帮助我完成任务。
谢谢你 Fennec
答案 0 :(得分:1)
随着扩张,我得到了这个:
这对你来说是不是令人满意的,因为线条可能太靠近并且与扩张合并在一起(就像最后两行一样)?
从头脑中尝试的其他东西:
-clustering。
- 低级方法,您可以计算每一行中的像素数以找出这些行的位置,然后计算每列中的像素数,以确定每行中单词的位置。