在Python中使用OCR从图像中提取文本

时间:2018-07-11 04:08:26

标签: python opencv tesseract python-tesseract pytesser

我想从图像的特定区域提取文本,例如身份证中的姓名和身份证号。我要从中提取文本的ID卡是中文(中文ID卡)。 我已经尝试过此代码,但是它只是提取了我不需要的地址和出生日期。我只需要名称 ID号

import cv2
from PIL import Image
import pytesseract
import argparse
import os

image = cv2.imread("E:/face.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename,gray)

text = pytesseract.image_to_string(Image.open(filename), lang='chi_sim')
print(text)
os.remove(filename)

我还附加了试图从中提取文本的图像。我已经尽力而为,但是没有成功。任何帮助和指导都将不胜感激。enter image description here

This is the binary image

2 个答案:

答案 0 :(得分:3)

我可以建议在查找文本信息之前进行预处理。该代码很容易理解。

代码:

image = cv2.imread(r'C:\Users\Jackson\Desktop\face.jpg')

#--- dilation on the green channel ---
dilated_img = cv2.dilate(image[:,:,1], np.ones((7, 7), np.uint8))
bg_img = cv2.medianBlur(dilated_img, 21)

#--- finding absolute difference to preserve edges ---
diff_img = 255 - cv2.absdiff(image[:,:,1], bg_img)

#--- normalizing between 0 to 255 ---
norm_img = cv2.normalize(diff_img, None, alpha=0, beta=255, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_8UC1)
cv2.imshow('norm_img', cv2.resize(norm_img, (0, 0), fx = 0.5, fy = 0.5))

enter image description here

#--- Otsu threshold ---
th = cv2.threshold(norm_img, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv2.imshow('th', cv2.resize(th, (0, 0), fx = 0.5, fy = 0.5))

enter image description here

使用它,让我知道您是否能够找到相关的文字信息!

答案 1 :(得分:0)

在pytesseract中,lan​​g ='chi_sim'试图将数字也解释为汉字。 使用lang ='eng'来获取正确的数字