Question

我需要处理一些文本图像，来自reCAPTCHA的图像。我想将图像切成碎片，每个都是一个角色的边界框。图像包含浅色字体颜色和深色字体颜色，所有图像都带有一些白色边距空间。

例如：

我已经将图像预处理成灰度并对它们进行了解偏。如何进行切片图像。如何摆脱白边，有没有一种方便的方法来填充具有类似文字背景颜色的边距？

Answer 1

通过查找轮廓使用opencv可以解决给定问题。查看findcontours文档中的opencv函数。它帮助我解决了这个问题。使用范围来限制轮廓创建的噪音。

image = cv2.cvtColor('image.jpg',cv2.COLOR_BGR2GRAY,1)
ret,thresh = cv2.threshold(image,150,255,0)
n_,contours,_ = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

将文本图像切割成字符的最佳方法

1 个答案: