如何使用openCV-python识别白色背景上的多张照片?

时间:2019-06-15 23:47:35

标签: python image opencv image-processing image-recognition

基本上,我已经使用打印机扫描了许多旧照片。扫描的每一页(在页面的四个角附近)都可以容纳约四张照片,并且空白区域不一定总是完全空白。我想使用openCV自动将它们裁剪为单张照片。需要解决此问题的方法的建议,谢谢!

我考虑过要检测页面上四个矩形的形状以获取坐标或使用opencvgrabCut ...我不知道

我尝试使用PIL,但是无法正确裁剪照片,因为某些照片的颜色也与背景相同,这会导致裁剪过早结束。

这是它看起来的粗略草图

This is a rough sketch of what it looks like(除非它们是人物的真实照片)

1 个答案:

答案 0 :(得分:1)

这是一种基于以下假设的方法:照片不会彼此相交

  • 转换为灰度和高斯模糊
  • 阈值图像
  • 查找轮廓并获取边界框轮廓
  • 提取投资回报率

阈值图像

enter image description here

接下来,我们使用cv2.findContours()获得轮廓,并使用cv2.boundingRect()抓取边界框。然后,我们可以使用

提取ROI。
x,y,w,h = cv2.boundingRect(c)
ROI = original[y:y+h, x:x+w]

这是结果

照片#1

enter image description here

照片#2

enter image description here

照片#3

enter image description here

照片#4

enter image description here

import cv2

image = cv2.imread('1.png')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (3, 3), 0)
thresh = cv2.threshold(blurred, 230,255,cv2.THRESH_BINARY_INV)[1]

# Find contours
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

# Iterate thorugh contours and filter for ROI
image_number = 0
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
    ROI = original[y:y+h, x:x+w]
    cv2.imwrite("ROI_{}.png".format(image_number), ROI)
    image_number += 1

cv2.imshow('thresh', thresh)
cv2.imshow('image', image)
cv2.waitKey(0)