文字图形分离

时间:2018-07-19 08:36:06

标签: python image-processing

我可以使用哪些功能对手写文档中的文本图形进行分类?我设计了Gabor滤波器组,对纹理进行了分类,我使用了旋转不变式和尺度不变均值和标准差。我考虑了不变矩和分区特征提取,但是这对手写数据没有太大帮助,也适用于空间领域。我需要知道可以在频域中使用的功能,以及如何使用python代码提取这些功能将非常有帮助。

1 个答案:

答案 0 :(得分:0)

我不确定基于频域的功能,但是存在几种基于空间域的功能,通过这些功能可以将给定的手写文档图像中的文本与图形分开,尽管功能的选择取决于您正在处理的图像数据的种类。 以下是可以用来实现壮举的方法。

  1. 基于连接的组件的特征:查找所有连接的组件,并使用其像素密度和大小为基础的特征,检查附近的连接的组件,如果它们的最高点和最低点具有相同的垂直位置(文字字符)。
  2. 您可以尝试使用基于深度学习的方法进行文本检测,从而将它们与图形分开,此处提供了参考-Text detection