我需要创建iOS应用程序,此应用程序允许用户捕获纸张并自动检测文本行,然后将每行提取为新图像。
实施例: 图像包含4行文本,处理后变为4个图像,每个图像包含文本行。
任何人都可以帮助我吗?
答案 0 :(得分:1)
1)首先,3x3高斯模糊或其他一些消除噪音的方法。
2)自适应阈值图像。您将文本设为白色,然后将其保留为黑色。 [如果你看到一些小的噪音因素,你可以在此之后应用一步腐蚀]
3)创建一个内核,在x方向上工作以进行扩张。应用10或更大的非常大的扩张。它只会在水平方向上扩大白色文本。
4)现在你有几个白色矩形。从原始图像中提取图像,其中从上面的结果图像中获取矩形大小和位置。您可以简单地对两个图像进行AND,以防您想要分开。
祝你好运,编码愉快。