图像预处理可提高OCR的准确性

时间:2017-04-25 10:19:56

标签: image opencv computer-vision ocr image-preprocessing

我正在使用高斯内核在OpenCV中进行图像增强,其中包含250%的内容:

import cv2
import numpy as np
image = cv2.imread("test.png")
small = cv2.resize(image, (0,0), fx=2.5, fy=2.5)

img = small

kernel_sharpen_3 = np.array([[-1,-1,-1,-1,-1],
                             [-1,2,2,2,-1],
                             [-1,2,8,2,-1],
                             [-1,2,2,2,-1],
                             [-1,-1,-1,-1,-1]]) / 8.0

output_3 = cv2.filter2D(img, -1, kernel_sharpen_3)

cv2.imwrite('enhancement.png', output_3)
cv2.waitKey(0)
cv2.destroyAllWindows() 

但仍然没有给出非常好的结果。我应该做哪些其他预处理来提高准确性?我使用ocr.space作为工具。

一些例子:

Image1 语言英语:

  • 错误地将 KIHC US 检测为 KI-IC US

Image2 语言英语:

  • 错误地检测到 HRL US HRI- US (排名倒数第二行)

Image3 语言英语:

  • 它没有检测到 BN FP

Image4 语言英语:

  • 错误地检测到 HPQ US I-IPQ US (但它已在下一行的HEN3 GR中正确检测到H)
  • 错误地将 LALAB MM 检测为 I-ALAB MM
  • 它没有检测到 RB / LN

0 个答案:

没有答案