通过文本检测器的bbox提高ocr准确性

时间:2019-07-25 14:58:59

标签: python ocr tesseract

我正在使用tesseract从图像中提取文本,图像是使用文本检测器获得的车牌图像

from PIL import Image
import pytesseract
import cv2

img= cv2.imread('text0.jpg')
print (pytesseract.image_to_string(th))

但是,它没有提供准确的文本,我可以使用任何过滤器来改善图像质量吗? 请查看并提供反馈。

1 个答案:

答案 0 :(得分:0)

您应确保文本水平,并且我希望此修改会有所帮助

from PIL import Image
import pytesseract
import cv2

img= cv2.imread('text0.jpg',0)
h,w= img.shape
img= cv2.resize(img, (w*2,h*2)) 
retval2,th = cv2.threshold(img,35,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

print (pytesseract.image_to_string(th))

您可以尝试其他方法,例如模糊和改变对比度。