Question

我想使用mser检测图像中的文本并删除所有非文本区域。使用下面的代码，我能够检测到文本：

import cv2
import sys


mser = cv2.MSER_create()
img = cv2.imread('signboard.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
vis = img.copy()
regions, _ = mser.detectRegions(gray)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]
cv2.polylines(vis, hulls, 1, (0, 255, 0))
cv2.imshow('img', vis)
if cv2.waitKey(0) == 9:
    cv2.destroyAllWindows()

如何删除所有非文本区域并获取仅包含文本的二进制图像？我搜索了很多但是找不到任何使用python和opencv的示例代码。

Answer 1

您可以使用找到的轮廓获取二进制图像。只需将填充的轮廓绘制成白色的空img。

mask = np.zeros((img.shape[0], img.shape[1], 1), dtype=np.uint8)
for contour in hulls:
    cv2.drawContours(mask, [contour], -1, (255, 255, 255), -1)

注意：有关drawContours的更多信息，请参阅the official docs

然后，您可以使用它来仅提取文本：

text_only = cv2.bitwise_and(img, img, mask=mask)

使用Opencv python中的MSER从图像中提取文本

1 个答案: