我需要处理一些文本图像,来自reCAPTCHA的图像。我想将图像切成碎片,每个都是一个角色的边界框。 图像包含浅色字体颜色和深色字体颜色,所有图像都带有一些白色边距空间。
例如:
我已经将图像预处理成灰度并对它们进行了解偏。 如何进行切片图像。 如何摆脱白边,有没有一种方便的方法来填充具有类似文字背景颜色的边距?
答案 0 :(得分:1)
通过查找轮廓使用opencv
可以解决给定问题。查看findcontours
文档中的opencv
函数。它帮助我解决了这个问题。使用范围来限制轮廓创建的噪音。
image = cv2.cvtColor('image.jpg',cv2.COLOR_BGR2GRAY,1)
ret,thresh = cv2.threshold(image,150,255,0)
n_,contours,_ = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)