Question

二，我试图提取的数字类型

另一个示例

上面的图片是另一张图片的输出，我试图从中提取所有数字。我正在单独选择每个数字，执行图像变换（阈值处理，图像对比，平均然后对比），其中似乎没有提供可靠和强大的输出。

使用阈值处理效果很好，但提取的数字的亮度并不总是相同，因此需要调整阈值以使其准确。我需要一些每次都能发挥作用的东西。我正在寻找的输出类似于下图。执行图像转换后，图像通过Tesseract OCR运行。当通过Tesseract放置下面的图像等时，输出几乎总是正确的。

图像变换后的所需图像：

此外，并非所有数字都相同。无论数字的大小，我都需要这个。有人可以帮忙吗？

Answer 1

没有人，你可能不需要自己完成所有这些，OpenCV已经实现了OTSU二值化方法，这完全适合你的情况。基本上它假设输入强度分布是双模态的。因此试图找到最佳阈值。您可以阅读更多here。这里是小代码以及生成的输出。

import cv2

img = cv2.imread("/home/abc/Downloads/1ltYB.png", 0)
ret, thresh = cv2.threshold(img, 10, 255, cv2.THRESH_OTSU)

print "Threshold selected : ", ret
cv2.imwrite("./debug.png", thresh)

输入（我已裁剪图片以删除额外的填充）

<强>输出：

从图像

1 个答案: