使用OpenCV Python提取所有边界框

时间:2014-01-14 01:39:57

标签: python opencv extraction bounding-box

我有一个包含多个边界框的图像 Books in Bounding Boxes

我需要提取其中包含边界框的所有内容。到目前为止,从这个网站我得到了这个答案:

y = img[by:by+bh, bx:bx+bw]
cv2.imwrite(string + '.png', y)

然而,它只有一个。我该如何修改代码?我尝试将它放在循环中以获得轮廓但它仍会喷出一个图像而不是多个图像。

提前非常感谢你。

2 个答案:

答案 0 :(得分:20)

你去了:

import cv2

im = cv2.imread('c:/data/ph.jpg')
gray=cv2.cvtColor(im,cv2.COLOR_BGR2GRAY)
contours,hierarchy = cv2.findContours(gray,cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE)
idx =0 
for cnt in contours:
    idx += 1
    x,y,w,h = cv2.boundingRect(cnt)
    roi=im[y:y+h,x:x+w]
    cv2.imwrite(str(idx) + '.jpg', roi)
    #cv2.rectangle(im,(x,y),(x+w,y+h),(200,0,0),2)
cv2.imshow('img',im)
cv2.waitKey(0)    

答案 1 :(得分:8)

一种简单的方法是找到所有轮廓,使用cv2.boundingRect获取边界矩形坐标,然后使用Numpy切片提取ROI。我们可以保留一个计数器来保存每个ROI,然后用cv2.imwrite保存它。这是一个工作示例:

输入图片:

enter image description here

检测到的ROI以绿色突出显示

enter image description here

保存的投资回报率

enter image description here

代码

import cv2
import numpy as np

# Load image, grayscale, Otsu's threshold 
image = cv2.imread('1.png')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Find contours, obtain bounding box, extract and save ROI
ROI_number = 0
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
    ROI = original[y:y+h, x:x+w]
    cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
    ROI_number += 1

cv2.imshow('image', image)
cv2.waitKey()