OpenCV Python:在图像

时间:2016-07-13 09:54:57

标签: python opencv computer-vision ocr tesseract

我正在使用Python2.7.12和OpenCV 3.0.0-rc1

我正在开展文本识别项目。

这就是我现在所得到的。 Original iamge after findContour, line 34

如您所见,图像中包含许多“框”,其中包含文本。

我的方法是找到这些盒子,将它们剪切成单独的图像,然后将它们送到TesseractOCR。

程序将整个图像视为一个轮廓。 我怎样才能找到里面较小的那个?

或者,如果您有其他方法,欢迎

代码:

import cv2


def threshold(im, method):
    # make it grayscale
    im_gray = cv2.cvtColor(im, cv2.COLOR_RGB2GRAY)

    if method == 'fixed':
        threshed_im = cv2.threshold(im_gray, 128, 255, cv2.THRESH_BINARY)

    elif method == 'mean':
        threshed_im = cv2.adaptiveThreshold(im_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 5, 10)

    elif method == 'gaussian':
        threshed_im = cv2.adaptiveThreshold(im_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 5, 7)

    else:
        return None

    return threshed_im


image = cv2.imread('demo4.jpg')

# threshold it
thresh = threshold(image, 'mean')

# find contours
_, cnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

print len(cnts)

cv2.drawContours(image, cnts, -1, (0, 255, 0), 20)
cv2.imshow('contours', image)
cv2.waitKey()

cv2.drawContours(thresh, cnts, -1, (0, 255, 0), 20)
cv2.imshow('contours', thresh)

cv2.waitKey()

`

1 个答案:

答案 0 :(得分:3)

您只获得最外层轮廓,因为您指定了.bar { border: none !important; } 。要获得图像的所有轮廓,您应该调用这样的方法:

cv2.RETR_EXTERNAL

查看OpenCV documentation以查看该功能的工作原理。