如何使用OpenCV从PNG文件中提取数字?

时间:2019-08-16 19:29:22

标签: python opencv image-processing ocr python-tesseract

我正在尝试使用OpenCv从.png文件中提取数字,然后从pytesseract中提取image_to_string()方法,但是输出效果不好。

image

我尝试了一些预处理方法,例如调整大小和噪声过滤器,但仍然无法获得准确的结果。我该如何处理?

2 个答案:

答案 0 :(得分:1)

这是使用pytesseract之前清理图像的简单预处理步骤

  • 将图像转换为灰度
  • 锐化图像
  • 执行形态转换以增强文本

由于您输入的图像看起来模糊,因此我们可以使用cv2.filter2D()和通用的锐化内核对图像进行锐化。可以找到其他类型的内核here

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

文本上有小孔,因此我们可以使用cv2.dilate()来关闭小孔并平滑图像

sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)
result = 255 - dilate

这是结果。您可以尝试仅使用锐化图像或带有pytesseract的增强图像

import cv2
import numpy as np

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

cv2.imwrite('sharpen.png', sharpen)
sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)

result = 255 - dilate
cv2.imwrite('result.png', result)
cv2.waitKey(0)

答案 1 :(得分:0)

我试图锐化图像;但是,我没有注意到使用tesseract进行数字提取方面的任何改进。我的建议是首先使用基于深度学习的超分辨率方法来改善this之类的图像,并使用tesseract进行数字提取。