带有不同字体大小的文本区域周围的边框

时间:2017-11-16 11:53:32

标签: python opencv image-processing ocr

我正在尝试实现某种文本检测算法,我想将图像分成每个区域包含不同字体大小的区域。

如此图片所示,例如: example

使用python和/或opencv有没有简单的方法来实现它?如果是这样,怎么样? 我确实试过谷歌搜索但找不到任何有用的东西.. 感谢。

1 个答案:

答案 0 :(得分:1)

这是一个有趣的问题。您需要采取一些步骤才能实现目标。我希望您充分了解基本的计算机视觉算法(openCV函数中的知识有助于)理解我建议的步骤。

  1. 使用形态膨胀过程将所有单词组合在一起。
  2. 使用openCV findcountour函数标记所有blob。这将为您提供每个blob的宽度和高度信息。
  3. 这是棘手的部分,现在你有每个blob的数据,尝试在数据上运行聚类算法,其中位置(x,y)和几何(宽度,高度)作为你的特征。
  4. 一旦正确聚类,就可以找到最左边,最右边,最顶部和最底部的数据来绘制边界矩形。
  5. 我希望这能为您提供足够的信息来开始您的工作。它不详细,但我认为它足以指导你。